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سلسلة من ااصدارات التي تعالج قضایا لغوية متنوعة 


مدير الشروع 1 
أ. خالد بن أحمد الرفاعي 
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هذه الطيعة 

إخداء من الرکز 

ولايسمح بنشرها ورقيا 
او نداولها تساريا 


كلمة المركز 

يجتهد مركز الملك عبداللّه بن عبدالعزيز الدولي لخدمة اللغة العربية 2 
العمل 3 مجالات متعددة تحقق تعميق الوعي اللغوي على المستويات المختلفة 
(الاجتماعية والعلمية/ الأهلية والرسمية) : وذلك للسمو باللغة العربية, 
وترسيخ منافستها SLU‏ الحضارية .2 العالم. وتعميق قيادتها الدينية 
والتاريخية لشعوب شتى 4 أنحاء المعمورة. 

اا Ludi‏ يتشعل ال 58 .285 مسال geil]‏ ستتضبا Mae S‏ اتلد 
او o bs Saca gc‏ تتاف كما o‏ ف مسال اا ت هن غل 
استكتاب مجموعة كبيرة من الباحثين ؛ لتأليف عدد متنوع من الإصدارات 
النوعية المقروءة التي تعالج عنوانات يقتنصها المركزء ويلفت الانتباه الیها. 
ویعلن من خلالها الفرص المکنة لخدمة اللغة العربية 2 الجالات الختلفة, 
فا يذلاك الحاجات التي یلمس المركز تطلع المكتبة اللفوية العربية إليها tay.‏ 
SESS‏ إلى أشنت المع نيا بحها وا ف ها مقن ماه Luis‏ د 
هذه الجالات. ویسعد الرکز بأن استقطب -2 المرحلة الأولى من هذا المشروع ما 
يربو على مثتي باحث؛ موسّعاً دائرة add‏ زان baubo al‏ 
che E c‏ و beca‏ تفای 
شأنه خدمة اللفة العربية بجمیم الوسائل والأطر. 

ویمثل هذا الکتاب واحدا من الکتب التي صدرت ضمن سلسلة (مباحث 
لغوية) يحتوي عددا من الابحاث لاساتذة مرموقین؛ استجابوا U‏ رآه المركز من 
الحاجة إلى التأليف تحت هذا العنوان. وبادروا إلى ذلك مشکورین. 

وتود الأمانة العامة أن تشيد بجهد السادة الولفین. وجهد محرر الکتاب. 
ومدیر هذا الشروع العلمي على ما تفضلوا به من التزام علمي لا پستفرب من 
مثلهم. وقد ترك الرکز للمحرر مساحة واسعة من الحرية 4 اختیار الباحتین 


RENEE 
تا — بناؤها وطرائق الإفادة منها‎ 


قند ۱ سار وق 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او نداو لها تحار پا 
ود 


ووضع الخطة العلمية - بالتشاور مع الرکز -؛ سعيا إلى تحقیق آقصی ما يمكن 
تحقيقه من الافادة العلمية. مع الأخذ بالاعتبار أن الآراء الواردة 2 البحوث لا 
تمثل رأي الرکز بالضرورة. ولکنها من جملة الآراء العلمية التي یسعد الرکز 
باتاحتها للمجتمع العلمي وللمعنیین بالشآن اللغوي لتداول الرآي ۰ وتعمیق 
النظر. ونلفت انتباه القاری الکریم إلى أن ترتیب آسماء المؤلفين على الفلاف 
موافق لترتیب أبحاثهم 2 الکتاب. وهي خاضعة للرقية النهجية التي تفضل 
الحرر - مشکورا- باقتراح خطتها. 

والشکر والتقدیر الوافر لعالي وزير التعلیم الشرف العام على الرکز. الذي 
يحث على كل ما من شأنه تثبیت الهوية اللفوية العربية. وتمتینها. وفق رژية 
ستشرافية محققة لتوجیهات قیادتنا الحکيمة. ویمتد الشکر معالي نائبه. 
وللسادة أعضاء مجلس الأمناء نظیر الدعم والتسدید لأعمال الرکز . 

والدعوة موجهة لجمیع الختصین والهتمین بتکثیف الجهود نحو النهوض 
بلفتنا العربية. وتحقیق وجودها السامي 2 مجالات الحياة . 


شنه ۱ انار وق 
إخداء من المركر 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


مقدمة المحرر 

do‏ لسانيات المدونات "E‏ المتون- (Corpus Linguistics)‏ من العلوم 
الحديثة التي أحدثت تغييرا منهجيا 2 دراسة اللغة. حتى إن هناك من يراها 
منهجية تدخل ب أغلب العلوم اللفوية. وعلى الرغم من ذلك فقد كانت محل 
جدل واسع + سبعينات القرن الماضي؛ كن هذا اتجدل نخيا وصان gs‏ من 
الاضي. 

إن الاستعانة باسانیات gall‏ اللفة العربية دوسا وجا وتعلما Lets‏ 
أمر ضروري إذا أردنا أن تأخذ لغتنا مكانها المستحق بين اللغات الحية؛ ولهذا 
فقد خرج هذا الكتاب ليقدّم لقراء العربية مادة حديثة من الأهمية بمكان أن 
يعرفوا عنها الكثير. 

جاء هذا الكتاب + خمسة مباحث تشرح وتناقش القضايا الرئيسة 2 هذا 
العلم المهم. فقد قَدّم لنا محمود إسماعيل صالح (محمود فيما بعد) 2 البحث 
الأول القضايا الرئيسة 2 المدونات اللغوية وكيفية الافادة منها بالقاء الضوء 
على تعريف المدونات اللفوية مرورًا بلمحة عن طرق الإفادة منها وعن أنواع 
المدونات اللغوية ومواصفاتها وانشائها. ومتطلبات التعامل معها. ثم مناقشة 
تفصيلية لمجالات الافادة من المدونات اللغوية 2 فروع البحث اللساني العام 
والتطبيقي والحاسوبي مع التمثيل لكل فرع. 

وي البحث الثاني يطوف بنا عبدالله بن يحيى الفيفي ( الفيفي فيما بعد) 
ب ميدان مدونات المتعلمين التي أضحت إحدى ركائز البحث 2 مجال اكتساب 
اللغة وتعليمهاء مستعرضا بعض الأسس النظرية مثل تعريف مدونات المتعلمين. 
وبيان أنواعهاء وما الذي يميزها عن غيرهاء مع استعراض المدونات العربية 
منهاء ليتحدث بعد ذلك عن المجالات التي تمثل أهم النماذج التي استفادت - 
ولا زالت تستفيد - من مدونات التعلمین» وهي: أبحاث اكتساب اللغة وتعلیمها. 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


والتحليل التقابلي للغة الرحلية. وتحليل الأخطاء بمساعدة الحاسب» ودراسة 
التطور اللغوي لدى الطلاب. وتأليف العاجم. وتدريس اللغة وتصميم المواد 
القليمية: وأخيرا البحث ب معالجة اللفة الطبيعية. وقد ختم حديثه بوسم 
الأخطاء 2 اللغة العربية. مع الوقوف على بعض النماذج العملية لطريقة وسم 
الأخطاء. 

ويأتي بعد ذلك المبحث الثالث الذي يتحدث فيه عبدالمحسن بن عبيد 
الثبيتي (الثبيتي فيما بعد) عن تصميم الدونات وبنائهاء ويقدم فيه إطاراً 
عملیا للإجراءات التي تمكن الباحث من تحقيق الشروط العلمية الرئيسة 
لتصميم الدونات (التوازن والتمثيل؛ والمنهج العلمي» والثبات) من خلال 
اتباع معايير واضحة لتصميم وجمع نصوص المدونة. كما وضح أهم ما يجب 
النظر إليه عند تصميم المدونات مثل لغة الدونة. وطبيعة نصوصها. وتاريخ 
النصوص, ومكان صدورهاء والأوعية التي ظهرت فیها . والمجالات المختلفة التي 
تغطيها. كما تطرق إلى حقوق الملكية الفكريةء وتحديد مصادر جمع النصوص. 
وكيفية جمع النصوص مع مناقشة بعض السائل التقنية عند الانتهاء من 
الجمع وهي ترمیز ملفات نصوص الدونة وتسمیتها وحفظها واضافة معلومات 
مساعدة 2 تعزیز الفائدة من الدونة من خلال تحشیتها بمعلومات اضافية 
مختلفة. وتحدّث بعد ذلك عن آهم الأدوات التي تساعد 2 تحلیل الدونات 
ودراستها. وهي: الاحصاءات العامة عن الدونة بمجملها. وقوائم التکرار. 
والکلمات الميزة للمدونات. والکشاف السياقي. والتصاحب اللفظي. ثم ختم 
البحث بمثال تطبيقي لما سبق شرحه. 

وبانتقالنا إلى البحث الرابع یخوض بنا عقيل بن حامد الشمري (الشمري 
فیما بعد) والثبيتي غمار التطبیق للسانیات الدونات؛ M‏ بقدمان نماذج 
تطبيقية. وعینات توضح طرق استخدام «لسانیات الدونات». وسبل استتمار 


امکاناتها الحاسوبية 2 رصد وتحلیل الظواهر اللفوية. معتمدین على «العربية 


قند ۱ انار وق 
اخد!ا: من الرکز 
و aas‏ بنشرضا ور Led‏ 
او تداو لها تحار پا 


الفصحی العاصرة» الستخدّمة 4# لفة الصحافة الكتوية .2 كافة الأقطار 
العربية. وقد وقع اختیارهما على هذا الوضوع لربط لسانیات الدونات بوصفها 
منهجية 2 الدراسة والتحلیل بالاشکال النظري التعلق ببعض ظواهر العربية 
العاصرة لكي یتسنی لهما مناقشة ما یتعلق بذلك من قضایا ومسائل مع التمثیل 
ENSE SU E‏ ساقات وتات 

آما سلطان بن ناصر المجيول (المجيول فيما بعد) فيأتي حديثه # البحث 
الخامس عن واقع البحث اللغوي العربي الحاسوبيء lajan‏ بطرائق البحث 
اللغوي العربي الحاسوبي بصورة أولية ترسم تمرحلات التحليل بواسطة 
المعالجة الحاسوبية بشكل مبسط؛ بدءًا بالتعريف بأنواع المدونات الحاسوبية 
للغة الطبيعية واتجاهاتها الممكنة والحتملة والمأمولة. مروزا بخصائص کل 
طريقة ومناهجها البحثية من حیث الفرض والتحلیل والمالجة. وصولا الی 
اقتراح بعض الوضوعات البحثية الهمة 3 هذا الجال. 

ویختم الکتاب بنظرة استشرافية يقدّم lg‏ صالح بن فهد العصيمي 
(العصيمي فیما بعد) ما یمکن لباحث 2 هذا الیدان أن يؤمّله للغته التي يرى 
ضرورة آخذها مکانها بين اللغات الحية بمواكبة التطورات اللسانية والتقنية 2 
شا diti‏ 

إن الهدف من cad‏ هذا الکتاب هو التعریف بلسانیات الدونات لقراء 
العربية وكيفية الافادة منها -2 بحوثهم ودراساتهم. بالاضافة إلى استعراض 
الدراسات التي أجريت على العربية ب2 هذا الیدان. فهذا الکتاب یستعرض 
امکانیات لسانیات الدونات وواقع البحث اللغوي العربي فیها والافاق التي 
یمکن أن تطرقها لحتنا فیها. ویعد هذا الکتاب الأول من نوعه بوصفه مرجعا 
متخصصا .3 مجال الدونات اللغوية باللفة العربية. حیث إن آغلب ما هو 
موجود عبارة عن آبحاث ومقالات -مع آهمیتها- تحدثت عن الدونات بشکل 


Wi‏ المدونات اللفوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


الکتاب موضوع الدونات بشکل آقرب إلى الشمولية. إضافة إلى ما آورده من 
التطبیقات اللغوية والحاسوبية للمدونات. والتي یمکن آن تکون ساسا افر من 
الأبحاث | لستقبلية 4 هذا الیدان. 

وهذا الکتاب 93 az‏ للباحث 2 العربية ولعلمها ولدارسها. وقد كان أسلوب 
الاب y a‏ كن من همه طلاب الدراسات Lat‏ بالاضافة الى لاب 
الرحلة الجامعية؛ بل حتى الأساتذة ذوو الخبرة الطويلة 2 اللفة العربية 
یمکنهم الإفادة من کثیر من السائل الطروحة هنا إذا رغبوا 2 الاطلاع على 
ما تم 2 هذا الحقل aM‏ .2 الهم. 

ویمکن للقارئ أن یستخدم هذا الکتاب بالبداية من آوله إلى آخره إن لم 
يكن على اطلاع كاف بلسانيات التون. كما یمکن لمن لديه خبرة + التخصص 
أن يقرأ المبحث eclipse‏ فا Vis‏ الكتاب وإن كان بينها تماسك 
عضوي فكل مبحث يقدمٍ مجموعة من القضايا مستقلة بذاتها. والكتاب ظ 
الوقت نفسه يصلح مرحنا اساسا وات تمرم 


إن تقديم الكتاب بهذه الصورة لم di‏ من بعض الصعوبات والتحديات 
التي حاولنا التعامل معها بما يمكن لنا أن نقوم به. فظهر بعض التداخل 2 
بعض مباحث الکتاب لکن کل مبحث عالج القضایا الخاصة من زاویته حتی وان 
بدت متشابهة مع الباحث الأخرى. كما كان ضرب الأمثلة باللغة العربية ليس 
da oL as Mae‏ الق سكيد نها هذا alidi oae‏ 
على اللغة الإنجليزية بالدرجة الأولى. أما قضية المصطلحات وترجمتها فقد 
شفلت Aldo orte‏ فترة تألیف هذا الکتاب. وذلك لایجاد مصطلح ینقل 
العنی الأصلي بظلاله ويعطي الدلالة العربية. 

ولا يسعنا الا أن تشکر مركز اللك عبداللّه بن عبدالعزیز الدولي لخدمة 
اللغة العربية على هذه البادرة الرائعة التي ستثري الدراسات العربية 2 هذا 


žaibai aia 


إخداء من الرکز 
ولايسمح بنشرغا ور قیا 8 3 
او urs‏ ديدي eu‏ ازللك عق لكوع 
تج — بناؤها وطرائق الإفادة منها 


الجانب» كما نخص بالشكر القائمين على سلسلة مركز الملك عبدالله بن 
عبدالعزيز للسانيات العربية. كما أتقدم بالشكر الجزيل للباحثين المشاركين .2 
هذا الكتاب على إسهامهم الذي سيخدم العربية وأبناءها ومتعلميها. والشكر 
موصول للذين يسألون ويستفسرون بشكل دائم عن لسانيات المدونات من طلاب 
وباحثين والذين كانوا الوقود الدافع للتفكير .3 هذا الكتاب وتأليفه. 


المحرر/ صالح بن فهد العصيمي 
الرياض 
YA‏ صفر ۱۶۲۱ هر 


salehosaimi )۵ ۱۷۵8۵0۵ 


هذه الطيعة 

إخداء من الرکز 

ولايسمح بنشرها ورقيا 
او نداولها تساريا 


تعريف بالباحثين المشاركين في التأليف 


سلطان بن ناصر المجيول: أستاذ علم لغة المدونات والتحليل اللغوي الآلي 
المساعد 2 جامعة الملك سعودء الرياض. درس الدكتوراه 2 مركز الدراسات 
الشرقية الأوسطية ومركز أبحاث المعجم 2 جامعة إكسيترء بريطانيا. عمل 2 
تعليم اللغة العربية لغير الناطقين بها منذ عام 4١٠٠م‏ حتى عام ۲۰۰۹م۰ كما عمل 
محررا -ومازال- للمجلة العالمية للدراسات الشرق الأوسطية International‏ 
Journal of Middle East Studies‏ وعمل محررًا لأبحاث انجليزية ذات علاقة 
بموضوعات إثنوجرافية وأنثروبولوجية ولغوية اجتماعية ‏ الخليج العربي 
بمركز الدراسات الخليجية 2 جامعة إكسيتر» وعمل محاضرًا متعاونا مدة عام 
ونصف L‏ جامعة إكسيتر بتدريس مادة القراءة بالعربية للمتقدمين والنقل 
الترجمي لنصوص القرآن الكريم لطلاب السنة الرابعة لمرحلة البكالوريس. 
TE‏ قسم التطوير بے كلية الآداب بجامعة الملك سعود مدة عام واحد. 

صالح بن فهد العصيمي: أستاذ الدراسات العليا المساعد للغويات 
التطبيقية والتربية + جامعة الإمام محمد بن سعود الاسلامية. الرياض. درس 
o gia‏ 2 كلية التربية ك جامعة لیدز. بریطانیا. وقد عمل مستشارا ومحکما 
نایکروسوفت B‏ عدة مشاریع برمجية خاصة باللفة العربية: كما عمل مستشارا 
4 مکتب التريية يك مقاطعة لیدز وی الجلس البلدي 2 مدينة لیدز وعضوا .3 
ليكة ea CURA‏ العا e gs C‏ صن مقن Meus eodd‏ للنسامية 
ے المجلس الاستشاري الدائم للتربية الدينية ) SACRE: Standing Advisory‏ 
.(Council of Religious Education‏ وهو معار ER‏ لشركة تطوير للخدمات 
التعليمية مديراً لشروع تطوير تعليم اللفة العربية 2 مشروع الملك عبد الله 
بن عبدالعزيز لتطوير التعليم العام. وقد حكم العديد من البحوث والمشاريع 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه العظبعة 
IET‏ من المركر 
ولايسمح بنشرها ور Led‏ 
او نداو لها تحار پا 
ود 


المتلعقة بلسانيات المدونات لجهات علمية وأكاديمية. كما درب معلمي وأساتذة 
اللغة العربية لغة ثانية 4 إندونيسيا والصين والمملكة العربية السعودية. 

عبدالله بن يحيى الفيفي: معهد تعليم اللغة العربية. جامعة الامام محمد 
بن سعود الاسلامية. الرياض. متخصص 2 معالجة اللغة الطبيعية. شارك 
.3 عدد من الشاریع العلمية .3 مجال معالجة اللفة العربية حاسوییاء له عدة 
آبحاث منشورة حول مدونات التعلمین. اضافة إلى مشارکته 2 تحکیم عدد 
من الأبحاث العلمية التعلقة بمعالجة اللفة الطبيعية لدی عدد من الدوریات 
العلمية والوتمرات. قام بانشاء الدونة اللغوية لتعلمي اللفة العربية. وبناء بمض 
التطبیقات الحاسوبية للمساعدة على وسم وتصحیح الأخطاء 2 النصوص 
العربية بمساعدة الحاسب. مهتم بعلم اللغة الحاسوبي وتعلیم اللغة بمساعدة 
الحاسب. اضافة إلى تعلم وتعلیم اللغة العربية باعتبارها لفة ثانية. 

عبدالحسن بن عبید الثبيتي: آستاذ البحث الساعد 2 الرکز الوطني 
لتقنية الحاسب والریاضیات التطبيقية بمدينة الملك عبد العزیز للعلوم والتقنية 
وهو الباحث الرئیس لمشروع الدونة اللغوية العربية لدينة اللك عبدالعزیز 
للعلوم والتقئية. عمل 4 مجال ادارة تقنية العلومات لعشرین lale‏ قبل انتقاله 
للعمل 2 مدينة الملك عبدالعزیز للعلوم والتقنية. حاصل على درجة الد کتوراه 
من جامعة ساري ببریطانیا من قسم الحوسبة. نشر العدید من الابحات 2 
المؤتمرات والدوریات الحکمة. مهتم بالصادر اللغوية العربية ومعالجة اللغة 
العربية والتنقیب .2 النصوص والتعقب الالي لتطور المعرفة 2 الجالات 
المتخصصة. 

عقيل بن حامد الشمري: آستاذ اللسانيات التطبيقية ae Lal‏ ورئيس قسم 
تدريب المعلمين بمعهد اللغویات العربية. بجامعة الملك سعود. الرياض. حصل 
على درجتي الماجستير والدكتوراه 2 جامعة کوینزلاند. أستراليا. اهتماماته 
البحثية تشتمل على اكتساب اللغة والحر افة/ ۰1100120۷ وأبحاث الكتابة باللغة 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


العربية, وتعلم اللغة بمساعدة الحاسوب. a‏ متماونا تون فاده 
«اكتساب اللغة الثانية» لطلاب الاجستیر 2 جامعة کوینزلاند . بالإضافة الى 
تدريس مادة «الحاسوب واللغة» لطلاب الماجستير 2 معهد اللغويات العربية. 
يعمل 2 مجال تعليم اللغة العربية لغير الناطقين بها. وشارك ك العديد من 
الدورات التدريبية لمعلمي العربية 4 عدد من الدول المختلفة. كما يعمل مستشارا 
غير متفرغ ب4 كل من مشروع الملك عبد الله بن عبد العزيز لتطوير التعليم العام 
(مشروع اللغة العربية) . ولجنة التخطيط اللغوي والسياسة اللغوية 2 مركز 
الملك عبد الله لخدمة اللغة العربية. 

محمود إسماعيل صالح (الصيني سابقا): تخرج + جامعة جورجتاون 
اللسانيات التطبيقية 2 جامعة الملك سعوذ. وقد أسس Jol‏ معهد paaki‏ 
لتعليم العربية للناطقين بغيرها 2 عام ۱۹۷۵ .2 الجامعة. كما أسس البنك 
5. بالإضافة إلى عمله الأكاديمي 2 قسم اللغة الإنجليزية © كلية الآداب 
بچامعة alit‏ سمود. مل خبیرا + هيئّة الخبراء بمجلس الوزراء السعودي 
(مجال الترجمة الرسمية) وعضوا باللجنة الاستشارية بمرکز اللك عبد الله 
الدولي لخدمة اللغة العربية. ومستشارا غير متفرغ .2 مشروع الملك عبداللّه 
لتطوير التعلیم العام (مجال تطویر معلمي اللفة العربية). تشمل آعماله آکثر 
آحادية اللفة وثنائیتها وستین كتابا 2 تعلیم العربية للناطقین بفیرها. 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


sse‏ انعر 
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أو تداو 


Aata aia 
اخداء من الرکز‎ E 
بنشرها ورقياً‎ EE 
تاو لیا تجارپا‎ al 


المبحث الأول 


المدونات اللغوية 10149 الافادة منها 


محمود اسماعیل صالح 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


alc‏ ار وق 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او نداو لها تحار پا 


المقدمة 

من الأمور التي لا یجهلها آحد أن الحاسوب هو آداة القرن الحالي دون 
منازع. فقد دخل تقریبا کل بيت وکل مؤسسة عامة وخاصة. وأدى استخدامه 
2 مجالات الحياة العلمية والعملية إلى تطورات كبيرة 2 الحقول الختلفة. ومن 
هذه الجالات میدان اللفة التي تمیز بها الانسان عن سائر الخلوقات. ویمکننا 
الافادة من الحاسوب 2 النشاط اللغوي بوجوه متعددة. یمکننا تلخیصها 2 
ثلاث صور رئيسة هي: الاستعمال العام (مثل منسق النصوص والتر جمة بمعاونة 
الحاسوب وقواعد بیانات الصطلحات). والاستعمال الخاص (أداة للبحث 
اللساني. كما هو الحال مع لسانیات الدونات اللغوية واستعمال برمجیات قواعد 
البیانات 4 تحلیل الأخطاء اللغویة) . والبحث اللساني الحاسوبي التخصص 
(مثل تطوير البرمجیات الختلفة للتعامل مع اللغة. مثل برمجیات التعرف على 
الاصوات وتولیفها والترجمة الالیة) . 

غير أن أحدث وآهم مجال لعبه الحاسوب ب خدمة البحث اللغوي هو مجال 
الدونات اللغوية corpora‏ ومفرده ( مدونة «(corpus‏ وهو موضوع هذا الکتاب. 
ولعل مما يلفت انتباه الباحث العربي أنه على الرغم من مرور نصف قرن تقریبا 
على آول مدونة إلكترونية 2 اللفة الانجليزية وحوالي ثلاثة عقود على البحث 
اللساني البني على الدونات الحوسبة فإننا نلحظ قلة إلمام اللسانیین العرب 
بها وبامکاناتها غير الحدودة. من هنا نأمل أن تکون هذه الدراسة بمثابة حافز 
للعلماء العرب للخوض .2 غمار هذا الجال و2 الافادة من الدونات اللفوية 
العربية 4 بحوثهم اللغوية. 

أولا؛ تعريف المدونة اللغوية 

لعل أبسط تعريف للمدونة اللفوية هو: مجموعة من النصوص اللغوية 
الشفوية أوالمكتوبة الموثقة (من حيث المصدر والتاريخ والنوع كحد أدنى). 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
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يقول ماكنري وزميلاه McEnery et al)‏ .; غ:7١٠٠3)‏ مك اللسانيات الحديثة. 
المدونة اللغوية يمكن تعريفها بآنها مجموعة من نصوص اللغة الطبيعية». ولكن 
بشكل أدق «يجب أن نضيف أن المدونات الحاسويية نادرًا ما تكون مجموعات 
اعتباطية من النصوص. فهي تجمع بصورة عامة لغايات محددة وغالبا ما 
تجمع لتكون (بشکل غير رسمي) ممثلة لبعض اللغة أو نوع من النصوص» 
Leech)‏ ۹41:117( . 

ومن التسميات الشائعة -إلى am‏ ما- اسم «الذخيرة اللغوية». والتي 
أطلقها رائد العمل العربي 2 مجال المدونات المحوسبة اللساني عبد الرحمن 
حاج ٠ (gius‏ غير أن تعريفه الوه اللغوية كما ورد 2 دراسته التي نورد 
Ludis‏ منها Lis Y‏ يختلف PN‏ عن الدونة اللفوية بالتعریف الذي ذکرناه 
(انظر عبدالرحمن صالح. ۰)۱۹۹۹. كما أن مها الربيعة (CAVEYY)‏ تطلق عليها 
«ذخيرة نصية» كما هو واضح من عنوان مشروعها السمی «الذخيرة اللصية 
الفصحى لجامعة الملك سعود». وهناك من آسماها بالکنز. كما فعل عبدالغني 
sil‏ العزم (حيث یتحدث عن «مکنز صخر» .2 مقاله «اللفة العربية والعالجة 
ا جراعم سكن شوهاب کلف فس du‏ اما sales‏ اغات ها 
علی الدونات اللغوية «المدونات النصية» (سلوی حمادة. ۲۰۱۶) غير آنها 
Lai [gizal‏ «المدونات اللغوية» 4 دراسة أخرى (سلوی حمادة؛ ۱۱ pn‏ و2 
دراسة حديثة لصالح العصيمي (۲۰۱۳) أطلق «لسانيات المتون» على لسانيات 
المدونات اللغوية. 

ولكن يبدو أن مدونة (لغوية) قد تكون الأكثر شيوعاء وهو الاسم الذي 
أطلق على آشهر مدونتين عربيتين معروفتين (مدونة مدينة الملك عبدالعزيز 
للعلوم والتقنية 2 الریاض, ومدونة مكتبة الإسكندرية التي سنتحدث عنهما 2 
صفحات لاحقة من هذا البحت) . وقد يتحرج البعض من استعمال كلمة مدونة 
لأنها تستخدم مقابل كلمة blog‏ أي المدونة الشخصية 2 الشابكة (الإنترنت)؛ 


قند ۱ انار وق 
إخداء من الرکز 
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لذلك كان الاقتراح بإضافة اللغوية للتمييز بينهما. (نود الاشارة بأننا قد 
نقتصر على مصطلح مدونة فقط. يدلا من مدونة لفوية. من باب الاختصار 
ولوضوح العنی 2 سياق هذا العمل) . 

من الناحية النظرية. قد تکون الدونة مجموعة من التصوص الجموعة 
دولا کما نجد ‏ الدونات السابقة لعصر الحاسوب. آو guo‏ کما هو 
الغالب الیوم. 


لکن نود أن ننبه على أن «الدونة» 2 سياق لسانیات الدونات اللغوية یقصد 
بها الدونة اللفوية الحوسبة, آي الخزنة رقمیاً 3 الحاسوپ. لذلك نجد أن 
البعض یتحدتون عن لسانیات الدونات باسم لسانیات الدونات الإلكترونية 
electronic corpus linguistics‏ 

وجدير بالذكر ب هذا المجال أن الشبكة العنكبوتية (الإنترنت) أو الشابكة 
يمكن اعتبارها مدونة لغوية شاملة. كما يشير الباحثان كيلغاريف وغرینفنستیت 
Adam Kilgarriff and Greogroy Grefenstette‏ 2 بحثهما العنون «الشبكة 
بوصفها مدونة لغوية «Web as Corpus‏ حيث يقولان 2 مقدمة بحثهما أن 
الشابكة «تشتمل على مئات البلايين من الكلمات من النصوص ويمكن 
استعمالها لجميع أنواع البحث اللفوي» Adam Kilgarriff and Greogroy)‏ 
.(Y** Y ,Grefenstette‏ 

ثانيًا : طرق الافادة من المدونات اللغوية 

من متابعة الأعمال البحثية الختلفة, لا بد لنا من التنويه إلى أن هناك 
اختلافا بين نوع المدونة (يدوية أو محوسبة) من جهة وبين طريقة الإفادة منها 
2 البحث اللغوي. فحتى الدونة المحوسبة يمكن البحث فيها يدوياً أو بأسلوب 
شبه يدوي» وهو ما نعتقد أنه حدث مع مدونة جريدة الجزيرة وعدد من الأبحاث 
التي أجريت عليها (كما 2: دراسات 2 علم اللغة النصي.... ۲۰۱۲) . وقد يتم 


۳۱ 


RENEE 
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إجراء البحث LS: Gu‏ هو الشأن 5 معظم الدراسات التي تمت على المدونات 
الاتجايزية: يدها tuos iba‏ والناوانيات اا خر توا دق انين disks‏ 
.Biber. Conrad and Reppen)‏ ۱۹۹۸) وكذلك ماكنري وزميليه ) McEnry.‏ 
[x .(Y** Tony. Xiao. Richard and Tono. Yukio‏ المشروع الذي 
آنجزه الباحثان الأمريكيان تم بکوولتر وديلويرث باركنسون 2 معجم الآلفاظ 
الشائعة 2 اللغة العربية .Buckwalter. Tim and Parkinson. Dilworth)‏ 
.)١‏ وكذلك أطروحة الدكتوراة لرجب الزهراني (انظر أدناه). (لزید 
من العلومات 4 هذا المجالء انظر «أعمال مبنية على مدونات لغوية عربية» 
المنشورة 2 مدونة الدكتور محمود إسماعيل صالح على الشابكة) . 

ولكن ينبغي لنا أن نفرق بين «الدراسات المبنية على المدونات -based‏ فف 
»وهي التي تفید من الدونات اللغوية بك البحث اللساني وفق E‏ نیس ها 
كالتعرف على شیوع کلمات أو تراکیب معيّنة أو التتبّت من ظواهر لغوية معيّنة, 
والدراسات التي توجهها المدونات corpus- directed‏ والتي تنتج من النظر 2 
الدونات اللغوية. حيث یصل الباحث إلى حقائق جديدة لم يكن یبحث عنها 
بالضرورة. لذلك لا یفرق البحث الموجّه بالدونات اللفوية بين العجم والنحو 
والتداولية وعلم الدلالة والخطاب: بل aum‏ منهجا TS‏ البحث اللساني» 
M7 Y* «39 McEnery et al)‏ للمزيد TN‏ الفروق بين النوعین من 
الدراسات. انظر ماكنري وزمیلیه. T T‏ ۱۱-۸). ولكن الفرعين كليهما يقعان 
تحت مسمى لسانيات المدونات اللغوية „corpus linguistics‏ 


خالثا : أنواع المدونات اللغوية 


يمكننا تصنيف المدونات اللغوية من زوايا مختلفة. كالعموم والخصوص 


والمعاصر والتاريخي. ومن حيث الوسم و عدمه .. 


أت من حيث العموم: 


۳۲ 


شنه العظيعة | 


اخداء صن المركر 0 
pug‏ بنشرها Lä ja‏ 
أو تداو لها تجاریا Wi‏ المدونات اللغوية العربية 

1 بناؤها وطرائق الإفادة منها 


-١‏ الدونة العامة: 


«مدونة اللغة العربية» و»المدونة الوطنية البريطانية British National‏ 
-«Corpus‏ 
تقنية أو علمية...): أوخاصة بمنطقة جغرافية (بلد أو منطقة معینة). 
أوخاصة بمؤلف ماء أوخاصة بنص ما «مدونة القرآن الكريم Qur'an‏ 
-«Corpus‏ 

۳- المدونة المقارنة أو التشابهة :comparable‏ 
هي الدونة التي تشتمل على نصوص متشابهة من حبك الحتوی (مثلا 
رسائل جامعية أو مقالات علمية 2 مجال (L‏ بلفتین أو صورتین 
مختلفتین للغة نفسها. ومن أمثلة ذلك الدونات التی تهدف دراستها 

, E 

للمقارنة بين كتاب مختلفين 2 كل من اللغتين أو نوعية اللغة. مثل 
آسالیب (Jal‏ اللغة ومتعلمیها من غير آهلها. وهذا النوع من المدوثات هو 
السائد 2 الدراسات اللغوية التقابلية .constrastive‏ 

غ- المدونة المتوازية :parallel‏ 


تشتمل على مجموعة من النصوص المتماثلة بلغتين مختلفتين (مثلا 
أحد النصين ترجمة للنص من لغة آخری) . ويستفاد من هذا النوع من 
الدونات 2 دراسات الترجمة والمترجمين. 

وجدیر بالذکر أن مشروعات وبرمجیات الترجمة الالية البنية على 
آسس إحصائية (مثل برمجیات شركة آي بي ام (IBM‏ تعتمد 
بشکل آساس على هذا النوع من الدونات. كما أن هناك برنامجا 
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على الشابكة لتطوير برمجيات الترجمة الآلية المبنية على المدونات 
المتوازية: Moses Statistical Machine Translation System‏ ( انظر 
قائمة المراجع). 

مدونة التعلمین learner‏ (متعلمي اللغة خاصة من غير آهلها): 

تتکون الدونة من آعمال آنتجها متعلمون للغة ( تلقائية 250001860105 أو 
مستنطقة (elicited‏ . وتفید هذه الدونات 9 تحلیل آخطاء الد ارسین من 
خلفیات ومستویات مختلفة. من ثم تفید آیضا 2 دراسات اکتساب اللفة 
الثانية. ومن أمثلة هذه الدونات: مدونة کامبردج للمتعلمین Cambridge‏ 
Learners’ Corpus‏ و مدونة لونقمان للمتعلمین Longman Learners!‏ 
ونام . وللغة العربية مدونات للغة التعلمین: احداها التي أنشأتها 
الياحثتان الماليزيتان ( انظر Hassan. Haslina and Nurahihan Mat‏ 
(Y Y Y 14‏ والأخرى تسمى «مدونة متعلمي العربية المكتوبة The L2‏ 
(Written Arabic Corpus‏ التي تم إنشاؤها 2 جامعة أريزونا بالولايات 
المتحدة الأمريكية بمركز المصادر التعليمية عن الثقافة واللغة ومحو 
الأمية ) CERCLL - Center for Educational Research in Culture,‏ 
.(Language and Literacy‏ وتعتبر هذه المدونة التي تتكون من ۲۰۰ 
dla‏ نموذجا لا یمکن آن یکون de‏ هذا النوع مین آلدوناته gue.‏ 
الباحتون ما يلي عنها: 

«تم وضع القالات الطبوعة 2 قاعدة بیانات قابلة للبحث. حيث تم وسمها 
بمستوی التعلم (مبتدیء ومتوسط ومتقدم). ونوع التعلم (دارس لغة 
ثانية أو التراث)؛ ونوع النص genre‏ (وصف وسرد وتعلیمات)» (انظر: 
 .(http://l2arabiccorpus.cercll.arizona.edu‏ وسیتحدت المبحث 
الثاني بکامله عن مدونات التعلمین بشيء من التفصیل. 
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5- المدونة التعليمية :pedagogic‏ 
وتشمل المواد التعليمية لمنهج ما لأغراض تعليمية مختلفة. (انظر 
.O'Keeffe. Anne. McCarthy. Michael and Carter. Ronald‏ 
(Yy‏ ويستفاد من هذه المدونات .2 تعليم اللغة و2 فحص المواد 
التعليمية ودراستها. 


ب- من حيث الزمن: 


۷- مدونة تاريخية :historical/diachronic‏ 


وهي المدونة التي تشتمل على نصوص من عصور مختلفة. بصورة 
متوازنة. للتعرف على التطور الذي طراأ على اللغة وعلى استعمالات 
ألفاظها ومعانيها وعلى تراكيبها إلى غير ذلك. وهذا النوع من المدونات 
اننهجي. بدلا من الاجتهادات الشخصية والحدس والتخمين. ومن 
أحسن الأمثلة لهذا النوع من المدونات: ARCHER‏ وتشتمل على نصوص 
للإنجليزية البريطانية والأمريكية للفترة ما بين ١76٠‏ و ۰۱۹۹۰ 

/- مدونة monitor às; Ul‏ (أي متابعة التطور اللغوي) : 


نجد أن بعض مؤسسات النشر المعجميء مثل دار كولينز البريطانية 
Collins‏ تهتم بمثل هذا النوع من المدونات التي ترصد المستحدثات 
المعجمية خاصة. عن طريق التحديث المنهجي للمدونة (قاعدة 
البيانات اللغویة) . وذلك بغرض تحديث معاجمها بين الفينة والفينة 
وإضافة ما يطراً على اللغة من ألفاظ جديدة أو ملا حظة الاستعمالات 
الطارئة لبعض مداخل تلك المعاجم. (انظر «Susan Hunson‏ 
(MY 0‏ 
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ج- من حيث نوع اللغة: 

4- اللغة المنطوقة/المحكية. مثل نصوص هاتفية. أو تعليقات اذ اعية, 
ومحادثات يومية. وهناك عدد محدود من هذه للهجة المصرية. ويجب 
التنبيه إلى الفرق بين المدونة البسيطة التي تحوّل النص النطوق إلى 
نص مكتوب فحسب وبين المدونة التي تسجل بصورة دقيقة النص 
الشفوي (من حيث الوقفات والثبر والتنغیم. كذلك مواقع الترردد 
والتكرار... إلى غير ذلك مما يحدث أثناء الكلام). ولكل نوع أغراضه 
وفوائده. ( من أمثلة هذا النوع من المدونات: مدونة بيرغن لإنجليزية 
مراهقي لندن (كولت) Bergen Corpus of London Teenage‏ 
(English (COLT‏ . ومدونة الإنجليزية المنطوقة للمحترفين Corpus‏ 
«of Spoken Professional English‏ ومدونة كول هوم CALLHOME‏ 
15 الخاصة بمحادتات هاتفية باللهجة المصرية (انظر قائمة 
المدونات). 
ويفضل أن تتوفر تسجيلات النصوص الصوتية للباحثين للرجوع إليها 


est ade 

Y^‏ مدونة اللغة المكتوبةء وهذا هو الغالب على المدونات اللغوية المختلفة. 
ولكن هناك مدونات تجمع بين اللغة المحكية والكتوية. مثل «المدونة 
الوطنية البريطانية „BNC‏ 

د- من حيث الوسم: 

annotations مدونة خام: ويقصد بها المدونة التى تخلو من أية تحشيات‎ -١١ 
(صرفية أو نحوية أو معجمية أو غيرها). وينطبق هذا على معظم‎ 
المدونات اللغوية المعروفة. خاصة العربية منها.‎ 
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—YY‏ مدونة موسومة tagged‏ : وهي المدونة التي بها تحشيات Tara)‏ أو 
diga‏ أن o ics Ios‏ مقف تعن ا jus Weah‏ 


قسم الكلام الذي تنتمي إليه (POS) part of speech‏ ومن deal‏ 
الأمثلة على هذا النوع من المدونات: Lancaster Parsed Corpus‏ 


(مدونة لانكستر المعرَبّة للغة الإنجليزية). ولأمثلة للمدونات اللغوية 
العربية العروفة. انظر القسم الأخير من هذا المبحث. 
iliis‏ مواصفات المدونات اللغوية 
من الأمور التي يجب أن تق خن بعين الاعتبار عند تصميم المدونات وتقويمها 
ما يلى: 
أ- الحجم الكبير (ويحسب بعدد كلمات المدونات): 
غالبا سا كوق كك امن e OM‏ للبذوتات Nd alis exhi cta‏ 
ینطیق بالضرورة على الدونات الخاصة. 
ب- الشمول وتمتیل استعمالات اللغة :Tepresentativeness‏ 
ويعني ذلك أن تشتمل الدونة على نصوص تمثل استعمالات اللفة الختلفة 
(الشفوية والکتوبة) . .2 To‏ الهدف من انشاء المدونة. قلا تقتصر المدونة 
RE,‏ على امال أو الوب متفه بر اف مه ماد 
ج - التوازن: 
من شروط المدونة الجيدة أن يكون هناك توازن بين أنواع أو فثات النصوص 
والتخصصات وغير ذلك مما يشمله معيار التمثیل. فلا يطغى مؤلف أو لهجة 
أو تكسن أدبى على غيره. (انظر: مل ..Biber‏ ۲۰۰۲ ۷۸ ): 


McEnery et al ;Y* +Y .Biber) ولأمثلة لتطبيق هذه العاییر. انظر مثلاً‎ 
«British National Corpus فهم للمدونة الوطنية البريطانية‎ 552 ) WV 
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وانظل أيضا ما رة عن sat‏ اللفرية العريية الى faasiga‏ 
عبد العزيز للعلوم والتقنية 4 الریاض. والمدونة اللغوية العربية الدولية التي 
انجزت +2 مكتبة الإسكندرية. 

على سبيل JEL‏ نجد أن مدونة براون الرائدة اشتملت على خمسمئة «نوع / 
جنس آدبي «genre‏ مختلف من الکتابات النقحة «edited‏ يمتل کل منها 
يتكون من ۲۰۰ كلمة (المجموع: مليون كلمة من النصوص النشورة) . وچ المدونة 
الوطنية البريطانية تم التأكيد على أن «الكلام الذي يجمع يؤخذ من Ale‏ 
تراعي التوازن من حيث العمر والجنس والطبقة الاجتماعية والمنطقة اللهجية» 
Meyer)‏ ۲۰۰۲:۱۸). 

ومن الدراسات المهمة التي عالجت معايير تصميم المدونات اللغوية مقالة 
سو أتكنز وزميليها Atkins et al)‏ 56.. ۰/۱۹۹۲ ومجموعة الدراسات التي 
وردت ك الكتاب الذي حرره مارتن وين Wynne‏ بعنوان: تطوير المدونات 
اللغوية: دليل للممارسات الجيدة ) Developing Linguistic Corpora: a‏ 
(Guide to Good Practice‏ الذي يجمع بين دفتيه مقالات مهمة لعدد من رواد 
العمل 2 هذا الجال. وقد صدر .2 العام ۲۰۰۵. 


خامسا : إنشاء المدونة اللغوية 


قبل الشروع 2 مناقشة هذا الإجراءء نود أن نشير إلى أنه قد يتم جمع 
النصوص بطريقة عشوائية أو منتظمة (وفق أسس محددة). كما يتم الإفادة 
منها كذلك بصور مختلفة. كالبحث اليدوي. كما فعل اللغويون العرب الأوائل 
عند وضع قواعد اللغة العربية ومعاجمهاء ودليل ذلك الاستشهادات التي نجدها 
2 کتب النحو والمعاجم. (انظر آحمد مختار عمر «مصادر اللغويين العرب» 2 
كتابه (البحث اللغوي عند العرب. ۱۹۸۸). كذلك نجد مثالا على ذلك ما قام 


به الباحثون 2 علم اللغة التاريخي 2 أوربا وما قام به اللسانيون البنيويون من 


Y^ 
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أمثال بلومفيد وسابير -2 دراساتهم للغات الهنود الحمر وغيرهم ممن عملوا 
2 اللسانيات اليد انية. وكذلك ما قام به لانداو وفاخر عاقل وداود عبده 2 
دراساتهم الإحصائية للكلمات العربية 2 نصوص مختلفة (انظر داود عبده. 
۶۹ ه) . وما قام به مایکل وست Michael West‏ 2 بریطانیا ومن قبله ومن 
جاء بعده من الباحثين + دراساتهم العجمية الا حصائية البنية على مدونات 
يدوية/ مکتوبة. 
آما إذا نظرنا إلى الدونات اللغوية من النظور اللساني الحدیث. فنود 
الاشارة إلى أن من الأمور التي يجب أخذها بعين الاعتبار عند تصميم الدونة 
اللفوية وإنشاتها ما يلي: 
اک یی کدف شم adire Qus adul alos Sos DE all‏ أن E‏ 
على الملامح المميّزة لنوع من النصوص.ء أو لأسلوب كاتب معین. أو 
التطور اللغوي وغير ذلك. (المبحث الثالث بكامله من هذا الكتاب 
مكرس لتصميم المدونات وبنائها) . 
ب- تحديد النصوص الناسبة. من حيث النوع والزمان والمكان والمصدر. 
فإذا كانت الغاية إجراء دراسات على اللغة العربية المعاصرة .2 
صورتها الكتوبة. فلا بد أن تشمل المدونة نصوصًا تمثل أنواع النصوص 


والأجناس الأدبية المختلفة من أدب (شعرء ونثر قصصى وغير 
قصصي. ومسرح. ومقالات آدبية...). والتخصصات العلمية المختلفة 


isse 855a‏ وك ةا 


ج- تحديد نسبة كل نوع. وفق أسس علمية ومنهجية: ويخضع هذا لمعايير 
إحصائية (مثل نسبة الكتابات الصحفية والكتب العلمية المنتجة 2 
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فترة محددة إلى الأعمال الأخرى) > كما يستفاد 2 ذلك من آراء 

3 البحث عن مصادر النصوص (مكتوبةء مطیوعة. رقمية. صوتية أو 
سمعية- بصریة) . 

هد جمع اللصوص من مصادرها الختلفة. 

و- تحویلها إلى نصوص رقمية موحدة من حیث التشفیر والترمیز. 

5= وسم 8 النصوص ) العنونة الصرفية والنحوية - كما یسمیها 
صوالحة (۲۰۱۱) - أي تحديد قسم الكلام لكل لفظة مثلا) إذا 
أمكن. جدير بالذكر أن بعض الباحثين يستخدم مصطلح التحشية 
annotation‏ بدلا من الوسم. ويشرح ليتش Leech‏ (۲۰۰۵) التحشية 
من الممارسات الشائعة للتحشية إضافة الوسوم tags‏ أو العناوين 
95 لبيان أقسام الكلام التي تنتمي إليها كلمات النص». وله دراسة 
مستفيضة 2 هذا الموضوع يناقشه من زوايا متعددة (انظر Leech.‏ 
(uni‏ 
و3 جميع الأحوال لا بد من توفر حد أدنى للتعليقات أو التعليم markup‏ 
السليطي وإريك أتويل دراسة مفيدة 2 تصميم مدونة للغة العربية 
المعاصرة «Al-Sulaiti, L and Atwell. E)‏ ۰۰7( . 

سادسًا: وسائل جمع نصوص المدونة وتخزينها 

مختلفة وتخزينها 339( pules‏ محددة. تتفق مع الأهداف MET‏ شا المدونة من 


| FEWUCLLIEMT 


اضدا: من المركر o‏ 
و Y‏ یسمع بنشرغا Lä ja‏ -— 8 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


آجلها. ویختلف هذا الجمع تبعا لنوع النص وطبيعته ومصدره. ونورد فيما يلي 
الأسالیب الختلفة لهذا الجمع. 
-i‏ النصوص الشفوية: 
هناك طرائق عدة لتخزین اللصوص الشفوية حاسوییا: )*( تحويل 
برامج الإملاء الآلي لهذا الغرضء مع ضرورة المراجعة الدقيقة لها. (Y)‏ 
.phonetic alphabet‏ وهذا مطلوب 4 تخزين النصوص العامية أو 
على الوقفة القصيرة والطويلة والتردد وما شابه ذلك من ظواهر يتسم 
بها الكلام المنطوق والحوارات. و4 جميع الأحوال لا بد لنا من تحديد 
الشفوية. انظر «Thomson, P‏ ۲۰۰۶ ). 
ب- النصوص المكتوبة یدویا: 
الوسيلة المعروفة هي تخزين النصوص يدويا عن طريق لوحة المفاتيح. 
ولكن يمكننا تخزين هذه النصوص نظريا على الأقل عن طريق الإملاء 
الآلي بقراءة النصوص واستعمال نظام تحويل النص الشفوي إلى 
نص مكتوب (كلام إلى نص (speech-to-text‏ . وقد ظهرت .2 الاونة 
الأخيرة تطبيقات تحؤل الخط اليدوي إلى مادة مطبوعة رقمية. 
ج- النصوص المطبوعة: 
وهو استخدام لوحة الطباعة/المفاتيح 4# الحاسوب. آما الأسلوب 
الآخر فهو باستخدام قارئة المحارف البصرية optical character)‏ 
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(reader: OCR‏ ؛ حيث يقوم البرنامج بمسح النص المطبوع ثم تحويله 
إلى نص رقمي. غير أن هناك مشكلات تواجه هذه الوسيلة. منها: 
)*( محدودية برامج قراءة المحارف البصرية من حيث تعاملها 
مع أبناط معينة (أي أشكال محدودة من (Y) (gal‏ ضرورة 
الوضوح التام لحروف النص الطبوع. (Y)‏ وجود نسية تقل أو تكثر 
وال م المحارف. مما يتطلب تدقيقاً دوا (من 

المعروفةء والذي يتعامل مع الحروف العربية واللاتينية) . 

د النصوص الرقمية: 

هناك عدة أنواع من النصوص المتاحة رقمياء لعل أهمها ما يلي: 
Word processors‏ . 

۲- التصوص التاحة علی الشابكة ( الانترنت) . 

.PDF اللصوص المتاحة 2 صورة‎ -Y 

- المواد المتاحة لدى شركات الطباعة والناشرين. 
وتحتاج هذه النصوص كلها الی: (۱) تحويلها إلى نصوص خالية من 
المعلومات الخاصة بالشكل format‏ أي نصوص رقمية بسيطة plain‏ 
(Y) .text‏ مراعاة توحيد الشفرة code‏ الستخدمة. لكي تتعامل معها 
برامج تحليل النصوص مثل المكشاف السياقي (Y) -concordance‏ 
تحويل النص المتاح 2 صورة PDF‏ إلى نص من الحروف قابل للتعديل 
عليه. من خلال ما يسمى بمحول البي دي اف «PDF converter‏ تم 
إخضاعه للخطوتين الأولى والثانية السابقتين 


YY 
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سابعا: مصطلحات مهمة .2 مجال لسانیات الدونات 
سنورد PR‏ من آهم مصطلحات هذا العلم. ولزید من الصطلحات انظر 
«مصطلحات لسانيات المدونات اللغوية» 2 مدونة محمود اسماعیل صالح على 


-i‏ تعليم المدونة :markup‏ وهو اعطاء معلومات عن مصدر المدونة وتاريخ 
النص ومؤلف النص ونوع النص genre‏ ويشمل الجئس gia‏ وغيره. 
ويكون ذلك خارج النص. لكن يلاحظ أن بعض الباحثين يستعملون 
المصطلح ليشمل جميع أنواع المعلومات التي تضاف إلى النص سواء 
داخله أو خارجه. مما يعنى اشتماله على التحشية والوسم. 

ب- التحشية annotation‏ وهي إضافة معلومات 4 داخل النصء مثل االوسم 

8 وهناك آنواع مختلفة للوسم. منها: 

(۱) قسم الكلمة (اسم» فعل. حرف). ويجدر ملاحظة أن التقسیم 
العربي التقليدي یحتاج إلى مراجعة وتفصیل آکثر عند وسم 
الکلمات. حتی یکون التحلیل أكثر فائدة ودقة. بناء على آهداف 
الدونات التي تختلف عن آهداف واضعي النحو وتقسیماته. (انظر 
محمود إسماعيل الصيني؛ (1Y‏ «نحو معجم عربي للتطبیقات 
الحاسوییة». وانظر تطبيقاً خيلا لنوع جديد من التقسيم # المعجم 
الذي أعده یکوولتر وياركنسون .Buckwalter and Parkinson)‏ 
(Y V‏ وهما من رواد العمل + مجال مدونات اللغة العربية 2 
الولایات التحدة الأمريكية. 


ولا بد من الاشارة إلى أن کتب النحو العربي تزخر بمصطلحات 
تتعلق بتصنیف الکلمات العربية یمکننا الافادة منها. من مثل: 
صمير» اسم موصول» اسم جامد. اسم pure‏ مشتق (اسم "t‏ اسم 


۳۳ 


قند ۱ سای وق 
اخداء من المركر 
والايسمح بنشرضا ورقيا 
او تداوليا تجاريا 
بود 


مفعول. صيغة مبالغة. صفة مشبهة. اسم آلة. اسم مکان)۰ اسم 
جمع» علم. مصدر. ظرف (مکان. زمان). فعل (لازم. متعد 
لفعول. متعد لفعولین. ناقص. ماض. مضارع. آمر...). حرف 
(جر» نصب. جزم. عطف. نفي..۰) . ويجب وسم الکلمات بمثل هذه 
التصنیفات لاجراء الدراسات العجمية والنحوية. (انظر مجدي 
صوالحة. ۱۱ ,Kais Dukes and Nizar Habash ENS‏ ۰۲۰۱۰ 
وكذلك مقال صوالحة وآتویل ۲۰۱۱ (Sawalha and Atwell‏ . 


(Y)‏ الوسم النحوي أو الاعرابي (لبیان الوظيفة النحویة/ الحالة 
الاعرابیة): 


الجملة الآولى: «الإيمان نور القلوب» 


الوسم الإعرابي: (مب (الإيمان) خب ( مض (نور) مض إل 
(القلوب) ) ) 


الشرح: 

الایمان = مبتداً (مب) 

نور القلوب < خبر (خب) 

نورح مضاف (مض) 

القلوب = مضاف إليه (مض (Jl‏ 

الستوی الأول: الایمان (مبتداً) + نور القلوب (خبر) 
الستوی الثاني: نور (مضاف) + القلوب (مضاف إليه) 


(یلاحظ أن عدد الأقواس يشير إلى مستوی التحلیل) 


Yt 


| iaaii شنه‎ 


اخداء سن المركر 0 
و prias Y‏ بنشرضا Lä ja‏ -— 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 

2 د بناؤها وطرائق الإفادة منها 


الجملة الثانية: «الإيمان يئير القلوب» 
الوسم الإعرابي: (مب (الایمان) خب (فع (ينير) مف ( القلوب) ) ) 
الإيمان = مبتداً 
ينير القلوب = خبر 
ينير = فعل 
القلوب = مفعول به 
المستوى الأول : الإيمان (مبتدأ) + ينير القلوب (خبر) 
المستوى الثاني: ينير (فعل) + القلوب (مفعول به) 
وجدير بالذكر أن المصطلح بنك الشجرات treebank‏ يستعمل للمدونة 
الذي یمثل الترکیب بشجرة مقلوية تتشمب فروعها LAUS‏ غالبا (مثلا تبداً 
الاطلاع على مزید من العلومات والأمثلة یمکنه الرجوع إلى الدراسة التي تمت 
2 جامعة لیدز البريطانية Kais Dukes, Eric Atwell and Abdul-Baqee)‏ 
Sharif‏ ۰)۲۰۱۰ كذلك الدراسة التي يقوم بها فريق من الباحثين 2 جامعة 
كولومييا P‏ يكية .)5١٠١ .Habash « Nizar, Reem Faraj and Ryan Roth‏ 
(Y)‏ الوسم الدلالي: أي المحددات الدلالية: ويقصد بها تحديد المعنر 
القصود من كلمة ما بصورة مختصر (Ó‏ وهو أمر لا بد منه خاصة 
للمشترکات اللفظية. فکلمة «عین» قد تأتي للدلالة على العين 
الباصرة (للانسان عینان) ۰ وعين الماء (ورد القوم العين ليستقوا) . 
وعين بمعنى الجاسوس (بث القائد العيون ليرصدوا تحركات 
العدو) . وعين التوكيد 4 النحو (هذه القضية عينها) . 


قند ۱ انار وق 
اهداء من jS A‏ 


ولایسمح بنشرها ور Là‏ 


او تداو لیا تجاریا 
ِا 
آسالیب الوسم المختلفة: 


آما طريقة الوسم فیستحسن اتباع ما یعرف بلفة التعلیم العيارية العامة 
(General Standard Markup Language: GSML)‏ . ولأمثلة تطبيقية على 
اللغة العربية. راجع الدراسات المشار إليها أعلاه عن مشروعات جامعة ليدز 
البريطانية وجامعة كولومبيا الأمريكية ودرسات ديوكز وزملائه. Dukes‏ 
Atwell and Sharif‏ ۰۲۰۱۰ وحبش وزميليه .Habash, Faraj and Roth‏ ۲۰۱۰ ۰ 

ومن الأمثلة على آسالیب الوسم الختلفة استخدام القوس التلث <> قبل 
وبعد الجزء الطلوب وسمه. مثلا لبيان أن النص من الشعر الأموي نکتب: 
<شعر آموي> آبیات من الشعر الأموي <شعر آموي/>. حيث تشیر العلومات 
بين القوسین المثلثين إلى أن النص من الشعر الأموي. كما تبين العلومات بداية 
النص ونهايته. ومن الأمثلة الأخرى استخدام الأقواس الربعة. مثلا [5....5] 
للدلالة على بداية الجملة ونهايتها. 

ولا بد من التأكيد على ضرورة بيان حدود العبارات التي تزيد عن كلمة واحدة 
للتعرف على بداية العبارة ونهايتها. وهذا ينطبق على التعبيرات الاصطلاحية 
والأمثال والأفعال المتعدية بحروف وما شابهها إذا أردنا للحاسوب أن یعیننا 2 
رها واا VEU.‏ 

ويمكننا وسم الكلمات بطريقة بسيطة. مثل: س-كتب» ف-كتب للتمييز بين 
الكلمة بوصفها اسماً وبوصفها b‏ وذلك عند غياب برنامج للتحليل الصر2. 

ويذكر باوكر وبيرسون Bowker and Pearson)‏ ۲۰۰۲) أن هناك نظاماً 
يسمى معيار تشفير المدونة ) (Corpus Encoding Standard: CES‏ اتفق عليه 
الباحثون 2 آوربا وأمريكا لتعليم النصوص وتحشیتها. تنقسم إلى ثلاث cul‏ 
هي: 


Y^ 


| FEWUCLLIEMT 


اضدا: من المركر o‏ 
و Y‏ یسمع بنشرغا Lä ja‏ -— 8 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


)1( التوثيقء ويقصد به الإشارة إلى معلومات ببليوغرافية عن النص ولفته 

(ب) بيانات أساسية: وتشمل معلومات عن مكونات النصء مثل الفقرات 
والعناوين والهوامش .... إضافة إلى معلومات عن الرسومات graphics‏ . 
الكلمات الخاصة بقسم الكلمة part of speech‏ والمعلومات الخاصة بالخطاب 
والوسم النحوي والوسم الدلالي... 

جدير بالذكر أن مفهوم التعليم markup‏ وكذلك نظام لغة ال SGML‏ 
مطبقان بصورة معدلة على بعض النصوص التوقرة على الشايکة. باسم 
.XML; «HTML‏ ويعني HTML: hypertext markup language‏ «لغة تعلیم 
اللص التشعبي». ويعني XML: extended markup language‏ «لغة التعليم 
الموسعة». (انظر «Bowker and Pearson‏ ۸۹-۲۰۰۲:۸۰). 

KEPE‏ أمثلة لمدونات للغة العربية 

e E EEE امد‎ E REC 
الرحمن حاج صالح. أستاذ اللسانيات الجزائري الذي يعتبر بحق آول من دعى‎ 
إلى إنشاء مدونة للغة العربية تسمى ذخيرة اللغة العربية منذ عدة عقود. وقد‎ 
نشرت الدراسة بفاهجلة اللسان العربي التابع لکتب تنسیق التعریب 2 العدد‎ 
ونورد فيما يلي آهد اف الشروع ومواصفاته كما وردت 2 الدراسة‎ .)۱۹۹۹( ۸ 
المذكورة:‎ 

3l‏ آهداف المشروع: 

يرمي مشروع الذخيرة اللغوية العربية إلى إنجاز ما يلي: 


.١‏ بنك آلي للغة العربية المستعملة بالفعل (بنك نصوص). 


۳۷ 


قند ۱ سار وق 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او نداو لها تحار پا 
ود 


من البنك الآلي المذكور (معجم مفردات). 

ب - مواصفات المشروع: 

Sita‏ ف اى :إلى (suba:‏ للغطيات التصية اود من 
الاستعمال الحقيقي للغة العربية ليضم: 

-١‏ المؤلفات ذات القيمة الكبيرة 2 الآداب والعلوم والتكنولوجيا وغيرهاء 
القديمة منها والحديثة. 

۲- الحاضرات الجامعية القيمة المنشورة. 

۳- القالات ذات القيمة النشورة 2 الجلات الأدبية والعلمية والبحوت 
القيمة المعروضة 2 الندوات والمؤتمرات والموائد المستديرة وغیرها. 

$= جميع المعاجم العربية والمزدوجة اللغة القديمة والحديثة (مثل لسان 
العرب والمعجم الكبير الحديث وغيرهما). والغرض من بنك النصوص 
الآلي هو أن يكون قاعدة معطيات ( أي بيانات) دائمة بحيث تقبل الزيادة 
للغة العربية وبالتالي أن تصير المصدر الأساسي لإنجاز المعجم الجامع للفة 
العربية الذي سيحرره العلماء وخاصة أعضاء المجامع العربية وإنجاز العدد 
الکبیر جا من الدراسات والبحوث 3 ART‏ العربية...» (عبدالرحمن الحاج 
صالح. 3444: UY‏ ولكن هذا المشروع الطموح لم يجد طريقه إلى التنفید 
حسب علمناء لأسباب عديدة یتعلق بعضها بالشروع وطبیعته " وبعضها بعدم 
توفر الموارد البشرية والادية اللازمة. 


)١(‏ الحرر: قد یکون العاتق آهداف الشروع ومواصفاته الطموحة التي لا تتواءم مع طبيعة الدونات ‏ ذلك 
الوقت ولا حتی 2 الوقت الحالي؛ ولذلك لا بد من وضع آهداف ومواصفات تراعي المکن لا المأمول 


والرغوب فيه مجردین. 


۳۸ 


| daiis] asus 


إضداء من a jS AM‏ 
ولايسمح بنشرغا ١ 1 LA ja‏ 
د بناؤها وطرائق الإفادة منها 


)*( مدونة مشروع معجم الطلاب (السعودي) الذي aael‏ لجنة من 
اللغويين السعودیین تشمل محمود اسماعیل صالح. وعلي الخبتي. 9 Jac‏ 
الرحمن الشمري. وعبد الله الشلال. وكان الهدف منها تأليف معجم للتلميذ .2 
المرحلتين المتوسطة والثانوية. 

وكانت مكونات المدونة: 

- المقررات الدراسية. 

- القرآن الكريم. 

- الحديث النبوي الشريف (رياض الصالحين): 

- نماذج أدبية عامة. 

- صحف ومجلات شيابية. 

= برامج إذاعية ومتلفزة شيابية. 

والمستوى) . 

(Y)‏ المدونة اللغوية العربية (المدونة العربية): 

sat‏ عت aoa)‏ کی deli disces Loa‏ العرية و T‏ مها مث خرف 
النصوص والمصادر. نورد أدناه مقتطفات من النبذة الرسمية عن المدونة من 
موقعها!": 

= تصميم المدونة العربية: 

إن مدونة مدينة الملك عبدالعزیز للعلوم والتقنية ستكون أكبر وأضخم 
مدونة لغوية للعربية. وهي 4# مرحلتها الاولی تسعى لجمع سبعمئة مليون كلمة 


(۱) الحرر: هناك أخطاء املائية وطباعية وصياغية قمت بتعديلها دون الإشارة إليها. 


۳۹ 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


وسوف يزداد حجمها إلى أن تصل إلى بليون كلمة بے مرحلة لاحقة إن شاء اللّه. 
راعى تصميم المدونة اللفوية العربية لمدينة الملك عبدالعزیز للعلوم والتقنية 
عدة معايير خارجية لاختيار نصوص المدونة تعتمد على خمس ركائز أساسية 
هي: البعد الزمني والبعد الجفرای. والوعاء العلوماتي. و المجال المعرب, 
والتصنيف الموضوعي. إضافة إلى هذا فان المدونة 2 مرحلتها الحالية هي 
للنصوص المكتوبة والكاملة فقط ولا تحوي أي نصوص منطوقه مثل الحوارات 
التلفزيونية أو الخطابات السياسية أو أي نصوص غير مكتملة مثل فصل من 
كتاب أو جزء من مقال. 
m‏ الیعد الزمني: 


أول المعايير التي تم مراعاتها هو عامل الزمن أو البعد التاريخي والذي 
يمتد من عصر ما قبل الإسلام وحتى عصرنا هذا والذي أثر على الوعاء أو 
الصورة التي ظهر فيها النص وكذلك على حجم النصوص المطلوب جمعها لكل 
فترة زمنية والذي كان على هيئة دالة أسية تتناسب مع تطور المعارف والعلوم 
والتدوين الخاص باللغة العربية بحيث يزداد عدد كلمات المدونة كلما قربنا من 
العصر الحديث ويزداد تنوع صورها Axa‏ كذلك. 

- البعد الجفرا2: 

ویقصد به الکان الذي صدر منه النص. ولأن الدونة تعنی باللفة العربية 
بمجموعها وتحاول أن تکون ممثلة للفة ومتفیراتها فإنه لم يتم تحدید بلد عربي 
بعينه لجمع النصوص بل إن الطلوب هو تنوع البلدان والکتاب أو الولفین. 
ویسعی تصمیم الدونة لجمع النصوص من جمیع البلدان والناطق العربية 
قدیما وحديثاء كما أن التصمیم لا يمنع ضم آي نص مکتوب باللفة العربية 
من أي ab‏ كان بحیث لا یطفی ab‏ أو منطقة على بقية البلدان أو الناطق قدر 
الامکان. 


قند dai‏ 
إخداء من الرکز 
ولايسمع بنشرها ور Led‏ 
او تداولها تحار پا 


- أوعية النشر: 

هذا هو البعد الثالث لتصميم المدونة. حيث تم اختيار ما يناسب كل فترة 
زمنية وما كان سائدا فیها من علوم ومعارف وما كان أکثر انتشارا وتداولا 
بين الناس من آوعية للنشر وما تکون لغته مناسبة ورصينة. فمثلا تم استبعاد 
النتدیات الحوارية وصفحات الانترنت الخاصة والتي يغلب علیها هذا الوقت 
اللهجات الدارجة ولا تتقيد باللغة العربية الفصحی. وتم اختیار عشرة 
آوعية للنشر وهي الخطوطات الحققة. الصحف. الجلات. الکتب. الرسائل 
الجامعية. الدوریات الحكمة. الاصدارات الرسمية. وکالات الأنباء. الانترنت 
والناهچ الدراسية. وتم اختیار هذه الاوعية بناء على انتشارها وتأثيرها 
و رصانة لغتها. وکل فترة زمنية من فترات الدونة لها ما یناسبها من هذه 
الاوعية. 

- الجال العرج: 

یندرج تحت کل وعاء من الأوعية الختارة مجالات مناسبة له. تحدد مجال 
اللص وسمته العامة. ففي الصحف على سبیل المثال هناك مجالان رئیسان 
هما الأخبار والقالات. و2 الخطوطات الحققة و2 الفترة التي کتبت فیها هذه 
الخطوطات كان هناك مجالات عامة مثل العقائد والفقه وآصوله وعلوم اللفة 
وغیرها بما یناسب کل فترة. وینطبق هذا على کل وعاء من الأوعية. وهذا البعد 
يعطي الدونة فرصة آکبر لایضاح الاختلافات بين كل مجال وآخر وفترة وآخری 
كما يوضع Lnd‏ تنوعها وتمثیلها للفة بشکل آکبر. 

- التصنیف الوضوعي: 

یندرج تحت کل مجال من الجالات الخصصة للاوعية Bae‏ مواضیع 
تفصل الجال وتوضح تنوعاته الأدق وتظهر الثراء والتنوع -2 کل مجال ووعاء. 
ففي sleg‏ الصحف وتحت مجال الأخبار هناك عدة مواضیع مثل الأخبار 


5 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


قند ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او نداو لها تحار پا 
ود 


الاجتماعية. الأخبار السياسية. الأخبار الرياضية:؛ الأخبار الاقتصادية... و2 
وعاء المخطوطات المحققة وتحت مجال أصول الفقه هناك عدة مواضيع مثل 
أصول الفقه الشافعىء أصول الفقه الحنبلی. أصول الفقه المالكى: أصول الفقه 
الحنفي وأصول الفقه USE‏ عشري. يعطى هذا البعد تنوعا وكراء وتخصصا 
أكثر لنصوص الدونة مما يجعل الفائدة أكبر منها بحيث يجد الدارس ما 
يناسبه لاختياره ودراسته ومقارنته. 

معلومات عامة عن المدونة: 

عدد الكلمات الكلى = ۷۳۹۱۱۹۰۱۱ 

عدد الكلمات بدون تكرار = ۷٤٦٤۳۹٩‏ 

Lass 4۵02۷۸ E لتصوض‎ E scia 

العدد الكلي للمؤلفين = ۱۹۰۰ «lala‏ (المصدر: الموقع الرسمي للمدونة 
اللغوية العربية لمدينة الملك عبد Jod‏ للعلوم والتقنية -(www.kacst.org.sa‏ 
وقد طورت المديئة TT‏ تست لتحلیل الدونات اللفوية باسم «الفواص». 
وهو متاح على الشابكة (الانترنت) 2 الموقع التالي http/ /sourceforge.)‏ 
(net/projects/kacst-acptool‏ . 

(Y)‏ الدونة اللغوية العربية الدولية: 

من مشروعات المدونات العربية الطموحة المدونة العربية الدولية 
International Corpus of Arabic‏ التابع لمكتبة الاسکندرية. وهي مدونة 
للعربية المعاصرة تطمح إلى بناء مدونة قوامها Aia‏ مليون كلمة. ونورد هنا 
مقتبسات من التعريف الرسمي للمدونة Ma‏ : 


— هدف المدونة اللغوية العربية العالمية: 


(Y)‏ المحرر: هناك القليل من الأخطاء الإملائية والطباعية والصياغية قمت بتعديلها دون الإشارة إليها. 
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قند ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


... بناء مدونة لغوية للعربية المعاصرة تحوي ٠٠١‏ مليون كلمة محللة 
La ue‏ ونحویاً ودلالیا. وقد روعي فيها أن تكون ممثلة لقطاع إقليمي كبير من 
الدول الناطقة باللفة العربية العاصرة وعاكسة بشکل حقيقي وواقعي لأنماط 
استخدام اللغة العربية العاصرة 2 آنحاء العالم العربي. بمجرد الانتهاء من 
بناء الدونة ستکون آول مدونة محللة ومتاحة کمورد لغوي للباحتین بصفة 
عامة والباحتین اللغویین بصفة خاصة لتفید 2 وصف نظریات اللغة من خلال 
الاستخدام الواقعي للکلمات. 

تخطيط المدوتة اللغوية العربية العالمية: 

لقد روعيت العديد من الأمور المرتبطة ببناء المدونة مثل التمثيل الجيد 
للنصوص ئ العربية المعاصرة والتنوع 2 cilia‏ النصوص ومحتواها والتوازن 
بين كل a‏ من النصوص وحجم الكلمات المجمعة 2 كل فئة من فتّات التجميع. 
عند النظر إلى تمثيل العربية المعاصرة داخل المدونة نجد أن الاهتمام الأساسي 
هو التغطية والتمثيل الواقعي لمختلف الصادر من كل المجتمعات العربية. 
dos‏ الد عدوا مق Ss at‏ رالات ااشنه التخوصض وداک موف 
تحقيق شروط التمثيل الجيد ومدى انتشار المصدر أو الفثّة. والتوازن بين كل 
مصدر وكل ia‏ وحجم الکلمات 2 كل مصدر وفة. 

ونجد أن تصميم المدونة اعتمد بالاساس على البدء بحصر المصادر 
الختلفة. وداخل كل مصدر تم إدراج الفئات المميزة له. وقد تم حفظ النصوص 
داخل المدونة بطريقة هرمية من خلال تسمية النصوص بطريقة توضح العديد 
من المعلومات مثل المصدر والفئّة وتاريخ النشر. 

aal‏ تم الأخذ 2 الاعتبار العديد من الأمور عند تجميع المدونة مثل عدد 
الفئات المتضمنة داخل المدونةء وعدد النصوص داخل كل فة من هذه alial‏ 


£Y 


5 ا‎ ETN 
تا مد بناؤها وطرائق الإفادة منها‎ 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


ا إلى موی na‏ کات اکل کل sad‏ نينا dé Raid‏ سوه سم 
مصادر التجميع. 

* يوجد أربعة مصادر أساسية: الصحافة والقالات الإلكترونية والكتب 
والدراسات الأكاديمية. الصدر الخاص بالصحافة منقسم إلى M5‏ 25 مصادر 

* يوجد إحدى عشرة Afa‏ على مستوى المدونة: العلوم الإستراتيجية والعلوم 
الاجتماعية والرياضة والدين والأدب والعلوم الإنسانية والعلوم الطبيعية والعلوم 

* يوجد أربع وعشرون فتّة فرعية: سياسة وقانون واقتصاد واجتماع 
ودين إسلامي ودين مسيحي وأديان أخرى ودين مقارن وقصص وشعر ونثر 
ودراسات لغوية وأدبية وطب وهندسة وزراعة وتكنولوجيا وعلم e Los MI‏ وعلم 
الفيزياء وعلم الفضاء وعلم الجيولوجيا والبيئة وعلم الكيمياء وعلم النفس 
وعلم الفلسفة وتاريخ. 

e‏ تغطي المدونة جميع النشورات داخل الوطن العربي وکذ‌لك يعض 
المنشورات العربية المنشورة خارج الوطن العربي. 

تحليل المدونة اللغوية العربية العالمية: 

oa Ls ds 3 adus as‏ ال ةد يكل که مهو eda‏ اة 
وقد تم 2 هذه المرحلة تحليل المدونة بطريقة آلية مبنية على بعض الطرق 
الإحصائية وبعض القواعد اللغوية بالاعتماد على أحد المحللات الصرفية 


£t 


قند ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


الشهيرة - تيم باك والتر (Tim Buckwalter)‏ - حيث يوضح التحليل الصر 2 
عددا من المعلومات كالسوابق واللواحق وقسم الكلمة وساقها وجذعها وجذرها 
ووزنها Lal‏ -2 بالاضافة إلى نوع الكلينة من حیث الجنس والعدد والتعریف تيع 
للسياقات المختلفة للكلمات داخل كل نص» (المصدر: المدونة العربية الدولية 
International Corpus of Arabic‏ التابع لمكتبة الإسكندرية). 


(f)‏ مدونات اللغة العربية اللأخرى: 


إن أفضل حصر للمدونات العربية إلى عهد قريب هو ما قامت به الباحثة 
لطيفة السليطي من جامعة ليدز Al-Sulaitie)‏ . ۲۰۱۰) غير أن القائمة مكتوبة 
باللفة الإنجليزية. وسنورد 2 نهاية المبحث آسماء الدونات اللغوية العربية 
| لمشهورة وتشمل ترجمة لقائمة à‏ لطيفة | لسليطي 5 متبوعة 5L.‏ تمتين اضا فيتين 
Lou‏ ا اند کیره تفیل کول دا gallos oll cya‏ 

تاسعاء متطلبات انتمامل مع الدونات 

تتطلب الافادة المثلى من الدونات ما يلي: 


- محرك بحث :search engine‏ وهذا أبسط برنامج يفيد الباحث 2 العتور 
على الکلمات 3 سیاقات مختلفة. وينبفي التنبیه إلى أن البرنامج قد یکون 
یط بحيث ینظر إلى الكلمة بمعناها الحاسويي (حسب (JAM‏ فقط) . وهو 
البرنامج التوفر balls:‏ مع «مدونة اللغة العربية» وبرنامج «غواص» التابعین 
لدينة الملك عبد العزيز للعلوم والتقنية بالریاض. أو يكون متطوراً بحيث يشمل 
aa‏ مك ات الجلان مكلذ اتج ورد EON‏ 
الكلمة .2 صورها الختلفة. وهذا النوع الأخير متوضر مع مدونة اللفة العربية 
التابعة لجامعة بريغهام يونغ (Brigham Young University: BYU)‏ 2 ولاية 
يوتا الأمريكية. 


£o 


Wi‏ المدونات اللغوية العربية 


تا مد بناؤها وطرائق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او تداو لیا تسار با 
ود 


- برنامج المكشاف السياقي .concordancer‏ لإعداد الكشاف السياقي 
- أي قائمة بألفاظ النص/المدونة 3 سياقاتها (ما يسمى بالانجليزية Key‏ 
«(Word in Context: KWIC‏ بترتيبات مختلفة: 
-١‏ الأصل: الكلمة المفتاحية key Word‏ مسبوقة ومتبوعة بعدد من الکلمات. 
حسب ورودها .2 المدونة. ويمكننا el‏ نطلب من البرنامج أن: 
؟- يجعل ترتيب أسطر الكشاف بناء على الكلمة المفتاحية وما يسبقها مباشرة 


right sorted 


؟- أو بناء على الكلمة المفتاحية ثم ما يتبعها مباشرة <... كتاب جدید.... 
کات تسوت عن جيف ویسمی dual can ll‏ بسارا dek sorted‏ ولا ài‏ 
من الاشارة إلى أن ربط الکلمتین «یمین» ویسار» بالسابق واللاحق یختلف 
2 العربية عن الفهوم 2 اللغات الاوربية التي تتجه الكتابة فیها من الیسار 
إلى الیمین. 
ویمتاز الکشاف السياقي بامکانات مهمة کثیرة. یجعله یختلف عن محرك 

البحث التقليدي. مثل احصاء التکرار وترتیب کلمات الدونة وفق شیوعها 

Goo)‏ آو تصاعدیا. آي بدء] بالأخيع آو Ja‏ شیوعا)» اضافة إلى العمل 

الأساسي له. وهو إيراد الکلمات .2 سیاقاتها. 
ومن أمثلة الکشاف السياقي برنامج Aconcorde‏ الذي آعده مجموعة من 

الباحثين 4 جامعة ليدز البريطانية. ويعمل مع النصوص العربية والانجليزية. 

وبرنامج الغواص alkhawas‏ اللذان صمما للباحث العربي. وبرنامجا 

Monoconc. Sketch Engine‏ اللذان يعملان بسلاسة نسبية مع النصوص 
العربية. غير أن تعليماتهما باللغة الإنجليزية. وبرنامج Word Smith‏ وهو 

برنامج متطور من إعداد Andaa‏ جامعة أكسفورد Oxford University‏ 


£1 


قاد الظيعة | 


اخداء من mu 5$ A!‏ 
ولايسمح بنشرها ورقيا -— 8 
أو تداو لیا تسار با 6 المدونات اللغوية العربية 
2 — بناؤها وطرائق الإفادة منها 


5 ولكنه لا يعمل بسلاسة مع النصوص العربية (لمزيدمن التفاصيل عن 
البرمجیات. انظرا لجیول 2 هذا الکتاب. الجدول ۳۱.الصفحتین ۲۶۶ و۲۶۵ ). 
- برنامج محلل صر morphological analyzer‏ للتعرف على الصورة 
الأساسية للكلمة - الجذع- وکذلك الجذر والوزن). وکذلك للفصل 
بين السوابق واللواحق التصلة بالکلمات. مثل بعض حروف الجر 
والعطف التصلة بالكلمة, وغیر ذلك. مكلا کلمة «فهم» قد تکون ف+هم 
(الضمیر). أو ف+هم (الفعل). أوالفعل ٠ m—‏ أو الاسم فهم. و الفعل 
«یکتبون» تعاد إلى جذعها: LS‏ » أو إلى جذرها : ك ت ب والوزن فعل. 
- برنامج لتحدید قسم الكلمة part of speech‏ الذي تنتمي اليه الکلمات. 
ما یسمی بالانجليزية .POS tagger‏ و2 غیاب ذلك یحتاج الباحث إلى 
عمل نك يدوي ادا کات هناف A Ls‏ لذ لك مال ذلك كلمة ,كافج كد 
تکون اسم فاحل آو فعلا حاضيا وکلمة al es‏ كون Val‏ مقرداء أن 
جمعًا (كما ‏ الحور المین), أو فعلا CA.)‏ فلانا) فلا بد من وسم کل 
كلمة لبیان قسم الکلام الذي تنتمي الیه. وهو pal‏ مطلوب 2 كثير من 
البحوث اللغویة. 
- برنامج تشكيل آلي یعتمد على الاعراب parsing‏ آي تحدید وظيفة الکلمة 
النحوية. ويسمى برنامج الإعراب parser‏ (أي FIENT‏ 
وللباحثة لطيفة السليطي دراسة مسحية شاملة لأنواع البرمجيات المتاحة 
للتعامل مع اللغة العربية على مستوى المكشاف والتحليل الصرك والتشكيل 
الال (انظر .(www.leeds.ac.uk/latifa/survey.htm‏ ومن الأعمال 
الجديرة بالاطلاع والافادة الدراسة التي نشرها مروان البواب (۲۰۱۲) بعنوان 
«محركات البحث 4# النصوص العربية «. ففيها مناقشة مستفيضة للجوانب 
الهمة ب4 محركات البحث -2 النصوص العربية ومشكلاتها. وهناك أيضا 


<۷ 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 
ءكءكد —— 


دراسة لصوالحة وأتويل يجريان فيها مقارنة بين بعض برامج التحليل الصر 2 
للغة العربية .(Y* +A Sawalha. M and Atwell: E)‏ 
- الوسم اليدوي manual tagging‏ لإعطاء معلومات عن الكلمات والتراكيب 
والجمل التي يحتاج إليها الباحث (مثل حدود التعبيرة الاصطلاحية أو 
العبارات المسكوكة ( كما يسميها البعض) . آي وضع علامة تدل على بداية 
العبارة وأخرى للدلالة على نهاية العبارة. ويلاحظ أن معظم المعلومات 
التداولية والخطاب تحتاج إلى وسم یدوي: فمعظم هذه المعلومات لا 
يمكن القيام به آليا لعدم وجود برمجيات يمكنها القيام بذلك دون تدخل 
بشري. 
- تطوير برنامج للوسم الآلي: هناك برنامج مفتوح المصدر open source‏ 
يسمى بوابة gate‏ لمساعدة الیاحث اللغوی .2 اعداد برمجيات للوسم 
الآلى. ( الموقع: .(Www.gate.ac.uk‏ يصفه الموقع بأنه: «مصدر مفتوح 
لإيجاد حل دورة حياة كاملة لمعالجة النصوص a full-lifecycle open‏ 
-«source solution for text processing‏ 
NIS‏ مجالات الإفادة من المدونات اللغوية 
أوالاً + بعض آنواع التحلیل .2 لسانیات الدونات: 
)1( ایجاد الترابط بين الجوانب اللفوية الختلفة: 
-١‏ معجمى -معجمى: أى كلمة مع مصاحبات لفظية. مثل باقة ورد. قطيع 
ماشية. مزاء الهر. 
۲- معجمي-ترکيبي: ul‏ کلمة تتطلب ترکیبّا ماء مثلا: الفعل الذي ینصب 
مفعولین آصلهما مبتداً وخبر. والفعل الذي یتبعه مصدر مقول أو 
adtal‏ 


1۸ 


هذه الظبمة | 
اخداء من E 5$ A!‏ 
ولايسمح بنشرها Led pg‏ -— 8 
أو تداو لیا تسار با 6 المدونات اللغوية العربية 
2 — بناؤها وطرائق الإفادة منها 


۲- تركيبي-تركيبي: أي تركيب يتطلب تركيبا معيناء مثل الخبر شبه الجملة 
الذي Lares doa dis‏ على ی ان كنا .2 sail‏ ماه Sos‏ 
(ب) ایجاد ترابط لفوي-غیر لفوي: أي العلاقة بين آلفاظ وتراکیب 
وأساليب لفوية ترتبط بموّلف» آومنطقة جفرافية أو بلفة ولهجة ما. أو ظواهر 
لغوية ترتبط بجنس أدبي (شعر آونثر مثلا ) i‏ أو ظواهر لغوية ( کالجمل الاسمية 
أو البناء للمجهول) وارتباطها أو كثرة ورودها ب تخصص معین (الطب أو 
الهندسة أو النقد). ومن أمثلة الترابط اللغوي-غیر اللفوي ارتباط بعض 
الألفاظ بمنطقة جغرافية ما ( كلمة «شغل» 2 المغرب العربی. مقابل «عمل» .2 
المشرق العربي) c‏ وعبارات وراق وسوق الوراقين وارتباطها بلغة التراث العربي. 
)>( دراسة أنواع النصوص الختلفة: آي دراسة النصوص الأدبية والعلمية 
والضحقية والقاتونية مكلا و خصائض كل Ato‏ 
ويمكننا أن نصنف أسلوب التحليل إلى نوعين: 
(۱) تحلیل کمی quantitative‏ (احصائی): مثلا بالنسبة لكلمة la‏ عدد 
مرات ورودها 2 اللص: ما المصاحبات اللفظية لها وما شیوع کل منها. 
(Y)‏ تحلیل كيفي/نوعي :qualitative‏ ويعني ذلك محاولة تفسیر الظاهرة 
اللغويةء مثلا: لماذا تشيع كلمة معينة أو تركيب ما 2 نوع من النصوص5: 
مثل شيوع الضمائر 2 اللغة المحكية مقارنة باللغة المكتوبة أو شيوع 
البني للمجهول .2 النصوص العلمية والتقنية (الانجلیزیة) مقارنة 
بالنصوص الادبية ( انظر ..Biber et al‏ ۱۹۹۸). 
فاقيا . آهم مجالات Bala ME‏ من لسانیات اشرات 
تعتبر الدونات اللفوية مصدرًا غنیّا للبحث اللفوي بشتی آنواعه» بل مصدرًا 
e ul auf‏ عفر فق ایا کا اس مكان سای من هذا انس 


£4 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او تداو لیا تسار با 
ود 


كان للمدونات المكتوبة والمحفوظة ( الشفوية) دورها + استنباط قواعد كثير 
من اللغات وأنظمتها الصرفية والصوتية وأساليبها البلاغية ومعاجمها أو 
استقرائها. كما فعل علماء العربية واللسانيون الغربيون الذين درسوا اللغات 
الأفريقية والأسترالية ولغات الهنود الحمر. ومن خلال المدونات اللغوية 
(النصوص) توصل اللسانيون إلى معرفة العلاقات بين اللفات. ومن ثم 
تصنيفها إلى أسر وفروع. كما حدث ‏ علم اللغة التاريخي. 

ولعل من أوائل هذا النوع من الدراسات 2 العصر الحديث الأعمال المعجمية 
الإحصائية التي استفاد منها صناع المعاجم بأنواعها المختلفة ومعدو مواد 
تعليم اللغات. خاصة لغير الناطقين بها. وسنورد فيما يلي نماذج للدراسات 2 
مجالات مختلفة اعتمدت أو يمكن أن تعتمد على المدونات اللغوية. 

)1( الدراسات المعجمية: 

¿lexicography الدراسة المعجمية وصناعة المعاجم‎ -١ 

كانت الدراسات المعجمية وصناعتها من أوائل التطبيقات العلمية والعملية 
للمدونات اللغوية (اليدوية # حينها). حتى من قبل التدوين الإلكتروني أو 
الرقمي. كما هو واضح من آعمال مايكل وست ۱۹۵۳ Michael West‏ وتورند ايك 
ولورج ۱۰۷۲ .Thonrndike and Lorge‏ 

که فا جردا cd‏ الات لحري 2 باس Sidar íi:‏ 
الباحث الرئيس ب4 مشروع مدونة COBUILD‏ الذي تم بالتعاون بين جامعة 
بیرمنفهام Birmingham‏ وناشر المعاجم کولینز Collins‏ ( انظر «Sinclair. J‏ 
881 

ويعد هذا التوجه من أشيع نماذج الافادة من المدونات اللغوية المطبوعة 
والمحوسبة. فقد كانت جميع قوائم شيوع الألفاظ 2 اللغات المختلفة مبنية على 
مدونات مختلفة. من هذه القوائم الرائدة 2 الانجليزية قوائم مايكل وست 


شنه العظيعة | 


0 المركر‎ VELIE 
8 —- Lä ja والايسمح بنشرضا‎ 
المدونات اللغوية العربية‎ W أو تداولها تجاريا‎ 

2 — بناؤها وطرائق الإفادة منها 


Michael West‏ وثورندايك ولورج Thorndike and Lorge‏ و العربية قوائم 
بریل ولانداو وفاخر عاقل وداود عبده (انظر agla‏ عبده, ۱۳۹۹ه). فقد قام 
هوّلاء بالاحصاء اليدوي للکلمات 2 نصوص مطبوعة للتعرف على الکلمات 
الشائعة فیها. کذلك قام بعضهم بأبعد من ذلك. حيث قام مایکل وست 
باحصاء تکرار العاني الختلفة للالفاظ semantic count‏ ( انظر Michael‏ 

.) ۱۹۵۳ «West 


تحدید مفهوم الکلمة والوحدة المعجمية 
والمصطلحات ذات العلاقة: 

من القضایا الهمة التی يجب التنبه لها عند الحدیث عن الدراسات 
العجمية التفریق بين الصطلحات د ات العلاقة بالکلمات وتعریفاتها الخلتفة. 
ومنها ما يلي: 

-١‏ الكلمة الحاسوبية: مجموعة من الحروف (أو حتى رمز واحد) مسبوقة 
بفراغ ومتبوعة èl pàs‏ مثلا: الأرقام والفاصلة أو علامة الاستفهام إن 
كانت مسبوقة ومتبوعة بفراغات. والکلمات «ویکتیون». «فكتبناهم» 
على الرغم من اشتمالها على عدة وحدات صرفية. 

-Y‏ الكلمة الفعلية/الئصية :token‏ وهي الكلمة كما ترد 2 النص بصور 
يكتبون... أو الاسم 4 صيغة المفرد والمثنى والجمع - تلمیذ. تلمیذان. 
تلامينذ...). ويستعمل المصطلح أحيانا ليعني الكلمة الحاسوبية إن 
كانت لغوية. 

-Y‏ الوحدة المعجمية lexeme‏ قد تكون كلمة واحدة أو عبارة تتكون من أكثر 
فخ ENTE MEE‏ اة EEEE A‏ 
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هذه الطيعة 
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او تداولها تسار با 
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-é‏ الجذع istem, lemma‏ وهي الكلمة المجردة من الزوائد الصرفية 
كعلامات الجمع أو التثنية أو الدلالة على الزمن 2 الأفعال. وهو للاسم 
E‏ م الفرد (وجمم اتکسیر؛ a s (Ded‏ کاتب: دك 
وللفعل صيغته 2 الاضي للمفرد الذکر. مثل: کتب. قال. وهو ما نجده 
2 مداخل العاجم الرتبة حسب الکلمات (آو النطق). 

5- الكلمة النوعية type‏ وهي الكلمة النوعية أو الكلمة الختلفة: هي الكلمة 
2 آية صورة بفض النظر عن تکرارها. 

7- الجذر root‏ )2 العريية. مثل: ك ت ب » ق و ل) والکون الأساس للكلمة 
2 اللغات الأوربية (من آمثلة ذلك الجذور اليونانية واللاتينية. مثل 
c (bio. geo. logy‏ إضافة إلى الصورة الأبسط للكلمة. 

۷- تجرید الكلمة من الزوائد (تجذیع :(lemmatization‏ ويعني ذلك 2 
العربية تحویل الكلمة إلى صورتها الاساس (الجذع) مع حذف الزوائد 
السابقة. مثل حرف الجر «ب» والعطف «ف» واللاحقة مثل الضمائر 
التصلة «t‏ ومها». فالکلمة الحاسوبية «فهم» تجرد إلى «فهم» الاسم 
والفعل. وكذلك إلى «ف +»هم». والکلمة الحاسوبية «بالقلم» نحذف 
منها الباء لتصبح «القلم». 

۸- قائمة الکلمات الستتناة :stop list‏ عند طلب الکشاف السياقي أو قوائم 
الشیوع 2 الدونة. هناك کلمات لانحتاج آحیانا إلى معرفة شیوعها 
(وهي ماتسمی بالکلمات الوظيفية. مثل الضمائر وحروف الجر أو 
مرو )اف ان po eset‏ تیف Dabo‏ أنيا أككر اكات سوه 
خ اللغة. 2 هذه الحالة یمکننا أن نعطي للبرنامج الاحصائي قائمة 
بهذه الألفاظ لیتجاهلها الحاسوب. وهذه هي التي تسمی قائمة 
الکلمات المستثناة Stop list‏ . 


oY 
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اضدا: من المركر 0 
والايسمح بنشرضا Lä ja‏ -— 8 
أو تداولها تجاريا 6 المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


9- شيوع الألفاظ :word frequency‏ للتعرف على مدى شيوع كلمة معينة 
أو تكرارها نقوم بعملية إحصاء الكلمات word count‏ مع ملاحظة 
التعريفات المختلفة لمفهوم الكلمة المذكورة آعلاه. والأصل .2 ذلك 
النظر إلى تكرار الكلمة النوعية أو الجذع بغض النظر عن صور ورودها 
فا (الکلمة الفعلية). ویجب التنبیه إلى عدم الخلط بين آنواع الكلمة 
بمفاهیمها الختلفلة الذکورة. وکذلك بين الكلمة والجذر. فالجذر 
P»‏ ف ر» تشتق dia‏ جذوع أو کلمات مختلفة تختلف من حيث شیوعها 
ومعانیها (غفر. استففر. غافر. غفار. غفور. مغفرة). 

۰ شیوع العاني semantic count‏ يشير هذا المصطلح إلى إحصاء العاني 
الختلفة للكلمة متعددة العاني .polysemous‏ وینطبق ذلك خاصة 
على الشترکات اللفظية homonyms‏ مثل «عين» الباصرة ومنبع الماء 
all,‏ التوکید, (sls‏ من هذه العاني تکرارها الخاص بها. ونجد Mia‏ 
لاحصاء شیوع العاني الختلفة للألفاظ 2 کتاب مایکل وست الريادي 
الذي أشرنا إليه سابقاً «Michael West)‏ ۱۹۵۲). 


all ۱۱ بالجانب‎ al ccoo zll 3 الات ال‎ - 

من أهم هذه المجالات مايلي: 

cod a‏ وود که ما موه ule‏ ار دق dali naso‏ لدوم رش 
عند اجراء هذا النوع من القارنة علینا أن نأخن بعين الاعتبار حجم كل 
ذکر التکرار 2 کل نص بغض النظر عن عدد کلماته. فالفروض أن ناحا 
إلى حساب التکرار اللسبي .normed count‏ آي ند کر تکرار الکلمة 2 
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كل ألف كلمة Wis‏ من النصين | (zig‏ كأن نقول إن كلمة «مسألة» ترد 
۰ مرة 2 كل ألف كلمة من النص أو ترد ۵۷ مرة 2 كل ألف كلمة من 
gail‏ 

۳- ما مدى شيوع معاني كلمة ما (الإحصاء الدلالي (semantic count‏ .2 
نص ما آو 2 نصوص مختلفة؟ نجد مثلا آنه ‏ الاستعمال العام ترد 
كلمة «عين» بمعنی البصر آکثر منها بمعنی عبن الماء. كذلك نجد أن كلمة 
«باب» بمعنى المدخل قد يكون أكثر شيوعا منها بمعنى فصل من كتاب. 

۶- هل للكلمة ارتباط بكلمات معينة (المصاحبات اللفظية - سابقة أو 
لاحقة)؟ مثلا: «جماعة من آهل العلم» و»فریق من اللاعبين» و»قطيع 
من الماشية». 

0- هل للكلمة ارتباط بلهجة أو نوع من الاستعمال اللغوي genre‏ أو غير ذلك 
من العوامل غير اللغوية؟ ( مثلا: كلمة تكوين بمعنى التدريب» والشغل 


بمعنى العمل 2 المغرب العربي) . 

7- ما مدى شيوع المصاحبات اللفظية العينة. بصورة عامة أو .2 لهجات أو 
أنواع من الاستعمال اللغوي؟ 

-V‏ ما مجالات استعمال الترادفات (وسیم. جميل أو کبیر. ضخم) 
وتوزيعاتها. حسب نوع النص مثلاً؟ 


۸- الاختلاف بين استعمالات الكلمة .2 حالتي الإفراد والجمع (مثلا كلمة 
«حبل» و»حبال» 3 القرآن الكريم ). 

4- التعرف على التعبيرات الاصطلاحية (المسكوكات) ومدى شيوعها 
عامة أو .2 أنواع مختلفة من النصوص. ويشمل ذلك الأفعال المتعدية 
SN‏ مكلت وکا كفن رة اقا 
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تا — بناؤها وطرائق الإفادة منها 


-٠‏ دراسة الجذور والحروف العربية من حيث تكرارها وشيوعها. ويعتبر 
علي حلمي موسی B‏ دراستيه ( بالتعاون مع إبراهيم أنيس وعبد الصبور 
شاهین) والخاستین بمعجمي لسان العرب والصحاح راكد هذا 
النوع من الدراسات ( انظر قائمة الراجع) . ومن الأعمال الرائدة 2 
العالم العربي ایشا (العجم الحاسوبي: احصاء الأفعال العربية 2 
العجم العربي) من اعد اد محمد الراياتي ويحي میرعلم ومحمد حسن 
طیان. ولکن یلاحظ أن هذه الأعمال عاملت بعض العاجم العربية 
بوصفها مدونات 3 انجاز الدراسات الشار الیها (انظر الدراسد 
یه pan Cid‏ هام elus‏ داف اراج aus‏ ید کر عدداً 
من فوائد المدونة اللغوية الإضافية. ومن الكتب التي عالجت بإسهاب 
كرا من القضایا المجمية کتاب سنکلیر الذي كان من الشرفین علی 
مشروع COBUILD‏ ومخررا لمجم BBC‏ للفة الانجلیزیة). 


صناعة المعاجم: 

يلاحظ أن اعداد العاجم (أحادية اللفة وثنائیتها) پستخدم الدونات 
لاغراض مختلفة. مثل اختیار آلفاظ العجم (الداخل) وکذلك حصر معاني 
الألفاظ (بناء على الكشاف السياقي والنصوص الأصلية- الشواهد) 2.5 
التمثيل لاستعمالات الداخل الختلفة (من واقع الدونة). من الشروعات 
الرائدة معجم -Collins COBUILD English Language Dictionary‏ 
ومن المشروعات الحديثة معجم كامبريدج للمحتوى الأكاديمي Cambridge‏ 
Academic Content Dictionary‏ الذي صدر عام ۳۰۰۹ والذي اعتمد مصادر 
رسمية وشبه رسمية للمعايير والاختبارات المقننة وماشابه ذلك 2 اختيار 
مداخله. كذلك يستخدم الحاسوب أحيانا 2 التحكم 4 لغة التعریف. كما فعلت 
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ولايسمع بنشرها Led pg‏ 
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لونغمان .2 معجمها «Longman Dictionary of Contemporary English‏ 
auge‏ حددت هذه اللقة بالالفی کلمة الأكخر شیوعا ف اللغة الاتجليرية. 

نجد الشيء نفسه 2 معجم كامبريدج للمحتوى الأكاديمي المذكور آنفا 
والموجه للطلاب كما یبدو. حيث يذكر محرره أن «تعريفات المعجم كتبت 
باستخدام مفردات كامبريدج للتعريفات «Cambridge Defining Vocabulary‏ 
وهي قائمة من كلمة شائعة والتي يعرفها الطلاب. وقد نم تطوير هذه 
القائمة بالافادة من الأجزاء المتعلقة بالإنجليزية الأمريكية من مدونة كامبريدج 
الدولية Cambridge International Corpus‏ وهی قاعدة بيانات تحوى أكثر 
من مليار كلمة مكتوية ومنطوقة» (مقدمة المعجم المذكور: Aii‏ 

(terminology دراسات المصطلحية (علم المصطلح‎ =Y 

أي التعرف على المصطلحات 2 الدونة. ومعرفة شيوعها 2 النصوص 
المختلفة. ( انظر .Bowker. Lynne and Pearson. Jennifer‏ ۲۰۰۲ الفصلين ^ 
c (^5‏ وانظر كذلك الدراسة التي قدمها عبد المحسن الثبيتي 2: الندوة الدولية 
الأولى عن الحاسب واللغة العربية: الأوراق البحثية. ۲۰۰۷؛ والدراسة المقدمة 
من عز الدين غازي -2 الندوة ذاتها. ولعل أفضل كتاب شامل بالعربية يعالج 
دور المدونات اللغوية .2 دراسة المصطلحات الکتاب الذي تر جمنه ريما بركة: 
ele‏ المصطح: مبادىّ وتقنيات (انظر ماري-كلود لوم. ۲۰۱۲ الفصول الرابع 
والخامس والسادس). 

ب- اللسانية العامة: 

T‏ الدراسات الصوتية: 


لعل أفضل مثال لهذا النوع من الأعمال المبنية على المدونات اللغوية ما قام 
به رائد هذا النوع من الدراسات 2 هذا المجال علي حلمي موسی. حيث يتحدث 
عن العلاقة بين الصوامت والصوائت 2 العربية من الوجهة الإحصائية. يقول 


كه 


شنه ۱ انار وق 
إخداء من المركر 
والايسمح بنشرضا ورقيا 
او تداو لیا تسا با 


2 معرض کلامه: «والدراسة التي نعرضها الیوم تمت على عینتین من القرآن 
الکریم |حداهما مكية وهي سورة الأعراف وبعض قصار السور والأخرى مدنية 
وهي سورة البقرة. ونظرا لأن الدراسة تتم على القرآن كما نسمعه ولیس كما 
نکتبه فقد اتبعت الطريقة الصوتية .... حيث نتبع طريقة قراءة حفص مع 
الوقوف على رؤوس الایات» (علي حلمي موسى» ۲۰۰۱). 

ومن الشروعات الهمة 2 مجال الاأصوات الشروع الذي قام به منصور 
الغامدي + مدينة الملك عبد العزیز للعلوم والتقنية 4 الریاض ( انظر الغامدي 
2 قائمة الراجع). 

ویجدر بنا أن نشير إلى أن أية دراسة إحصائية عربية للجذور 2 العاجم 
هي 2 واقع الأمر دراسة لأصوات العربية. خاصة الصوامت. لأن الجذر یتکون 
من حروف (أي آصوات). عليه فإن جمیع آعمال علي حلمي موسی التعلقة 

خانیا: الدراسات النحوية والصرفیة: 


یمکننا أن ندرس هذا الوضوع من زوایا عديدة» مثل شیوع التراکیب بعامة 
أو تراکیب معينة 4 آنواع من النصوص الختلفة. (انظر لأمثلة على ذلك: 
الفصلین الثالث والرابع من Biber, Conrad and Reppen‏ ۰۱۹۹۸ وكذلك 
الفصول ۱۱۰۱۲۰۱۱۰۱۰ -2 Aijmer and Altenberg eds‏ . ۰۲۱۹۹۱ 


أمثلة للبحوث 2 المجالات النحوية والصرفية: 


يبدو أن معظم الدراسات الأولى التي استفادت من المدونات اللغوية كانت 
anal nad adi‏ ولكق عقاف Mal sta Lacs‏ ك استخوامها ‏ الدراسات 
النحوية والصرفية. خاصة 2 بعض اللغات مثل الانجليزية. كما نلاحظ .2 
بایبر وزملائه .Biber et al‏ ۰۱۹۹۸ ومایر «Meyer‏ ۰۲۰۰۲ و اند وألتنبيرغ 
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Aijmer and Alternberg‏ , ۰۱۹۹۰۱ ونورد أدناه أمثلة لهذا النوع من الدراسات 
التي يمكن إجراؤها على اللغة العربية: 

-١‏ شيوع وتوزيع التراكيب النحوية المختلفة (الجمل الاسمية والفعلية, 
التركيب الوصفي والإضاكء البني للمعلوم والمبني للمجهول. والبني 
للمجهول الذي يشمل الفاعل -2 صيغة «بواسطة» أو «من قبّل» فلان أو 
كذا...) 2 اللغة بصورة عامة أو 2 النصوص التي تنتمي إلى مجال 
معين أو منطقة جغرافية أو فترة زمنية. 

۲- ارتباط التراكيب بألفاظ أو تراكيب أخرى معينة (مثل ما نجد 2 العلاقة 
بين كان وأخواتها وأسمائها وأخبارها). 

۳- ارتباط بعض التراكيب مثل أن المصدرية مقابل المصدر بأفعال معينة 
أو ارتباط بعض الأفعال المتعدية إلى مفعولين بتراكيب معينة (مثلاً 
أصلهما مبتداً وخبر أو أصلهما ليس مبتداً وخبرًا) . 

-٤‏ العوامل التي تؤدي إلى اختيارنا لتراكيب وتفضيلنا لها على تراكيب 
مشابهة ب المعنى أو الوظيفة (كالجملة البنية للمعلوم والجملة المبنية 
للمجهول .2 الأساليب الحديثة خاصة). من أمثلة ذلك كثرة ورود 
الجمل المبنية للمجهول 4 النصوص العلمية والتقنية. حيث التأكيد 
على العمليات والإجراءات بدلا من الاهتمام بالفاعل. كذلك نجد كثرة 
الأفعال والصفات 9 النصوص القصصية: لما لهذه الجوانب من أهمية 
2 سرد الأحداث ووصف الشخصيات 2 القصص. 


ه- دراسة المشتقات والصيغ الصرفية المختلفة ومدى شیوعها 2 نصوص 
أو آنواع من النصوص الختلفة. وكذلك للتعرف على الأوزان والصيغ 
الختلفة. مثل اسم الفاعل وصيغة المبالغة «JU‏ أو المصدر الصناعي 
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ومدی انتا جية productivity‏ بعضها ( كثرة أو قلة استخدام وزن ما 2 
تولید الکلمات الجدیدة مثلاً). 

5- دراسة السوابق واللواحق الختلفة ( .2 الانجليزية مثلا: in~: un~: -tion.‏ 
(ity: ic. -ism‏ وشیوعها .2 النصوص الختلفة. مثلاً ی هذه اللواصق 
اك ورودا .3 التصوص الملميةة وأیها آکثر استعمالا ج التصوص 
الصحفیة؟ و2 العربية یمکننا مقارنة شیوع لواحق جمع الذکر السالم 
tls‏ السالم تقلا ك جمع الکلمات القترضة dia S Sa)‏ استعمال 
الالف والتاء 2 معظم الکلمات القترضة. مثل کومبیوترات وتلفزیونات 
وموبایلات) . 

۷- دراسة شیوع آنواع الأفعال الختلفة. مثل الأفعال الدالة على الحركة 
(مشی. جری) والدالة على التفیر أو الثبات من جهة. والصیغ الزمنية 
الختلفة 2 أنواع النصوص الختلفة. مثلاً .2 البحوث والرسائل العلمية 
نجد أن الباحث پستخدم صيغة الستقبل 2 بعض الفصول والاضي 2 
فصول آخری. 

۸- معرفة نسبة ورود آقسام الكلمة parts of speech‏ الختلفة 2 الدونة أو .2 
أنواع التصكوصن تفه (مكلا مه Js‏ السار 3i acu A‏ 
نص أو نوع معين من النصوص) . 

4- لعل من المجالات المهمة 2 النحو العربي دراسة قضية أقسام الكلام 
وتصنيف الألفاظ العربية من منظور جديد (مثلاً سبعة أقسام اقترحها 
تمام حسان, بدلا من الثلافة العروفة (انظر محمود الصيني, ۱۶۱۲ه). 

۰ من الدراسات التي لم تلق العناية الكافية. وهي جديرة بالبحث 2 
ضوء لسانیات الدونات الصیغ الختلفة التي تعبر بها العربية عن الزمن 
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والوجهة (tense and aspect‏ مثل «كان قد فعل. قد فعل. كان یفعل. سوف 
يكون قد فعل...» وماشابه ذلك ( انظر (34A ‘Sieny, Mahmoud‏ 

irs‏ التطور التاريخي للغة من حيث المعجم والتراكيب النحوية: 

تفيدنا المدونات التايخية أو اللغوية عبر العصور 2 هذا النوع من الدراسات 
(انظر Biber, Conrad and Reppen‏ ۲۲۹-۲۰۲ ). من أمثلة هذه 
المدونات المدونة التاريخية المشهورة للغة الإنجليزية للفترة مابين ۱۱۵۰ إلى 
ARCHER 144-‏ إعداد باحثين 2 جامعة أريزونا الشمالية Northern‏ 
Arizona‏ بالولايات المتحدة الأمريكية. ومدونة هلسنكي Helsinki‏ للفترة من 
۰ إلى ۱۷۱۰ من تاريخ اللغة الإنجليزية. 

إن أي معجم تاريخي للغة العربية لا يستغني عن مدونة تاريخية شاملة 
وممتلة للعضون الختلفة, تقدم 1543 متوازناً من التصوص الختلفة لكل فترة 
زمنية (بحسب القرون أو العصور الادبية). یحددها التخصصون .2 اللفة 
والأدب العربي, مثل العصر الجاهلي. والعصر الاسلامي, والعصر الأموي.... 

رابعًا : تحلیل الخطاب discourse analysis‏ وتحلیل النصوص text‏ 
:analysis‏ 

من المعروف أن هذين الفرعين من اللسانيات يتعاملان مع العلاقات 
فوق مستوى الجملة. بما 2 ذلك قضايا الترابط النصي cohesion‏ والدلالي 
60 ومن أمثلة هذا النوع من الدراسات شیوع استخدام الضمائر 
2 النصوضن الشفؤية مقايل eL NR‏ والمسافة يتن الضمير الغاكد 
والاسم الذي يعود إليه 2 هذه النصوصء وكذلك اختلاف الصيغة الزمنية 
a a aat‏ النلنية (SE htl e a asse‏ 
(انظر :YYY-344A:Y* 1 «Biber, Conrad and Reppen‏ و «Marcus Callies‏ 
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۲۸ و 2100 ۱۹۹۱) انظر Lui‏ محمود اسماحیل مالي ۲۰۱۶ اة 
عربية 2 هذا الجال. 

خامسًا : التداولية pragmatics‏ و أعمال الكلام :Speech acts‏ 

من الصعب أن نتصور أية دراسة لسانية تعالج الاستعمال اللغوي والعلاقة 
بين اللغة والوظائف والمواقف الاجتماعية 2 غياب مدونة مناسبة تشتمل على 
أمثلة واقعية لهذا الاستعمال اللغوي. ونلاحظ أنه 2 غياب مدونات لنصوص 
واقعية قد يلجأ الباحثون إلى ما يسمى بالنصوص المستنطقة elicited‏ (مقابل 
التلقائية (spontaneous‏ . ومن الأمثلة على هذا النوع من الدراسات البحث 
الذي قامت به عبير الطويل وزملاؤها 2 الأردن عن «المراوغة /التحاشي 
hedging‏ 2 الخطاب السياسي 2 العربية والإنجليزية Taweel. Abeer et)‏ 
۵1 ومن النماذج من الدراسات 2 هذا الجال باللفة العربية مجموعة 
الدراسات التعلقة بالخطاب والتد اولية الواردة 2 کتاب: دراسات .2 ele‏ اللغة 
النصي: مقاربة تطبيقية على مدونة الجزيرة. ۰۲۰۱۲ ولزید من العلومات 
حول الدونات اللفوية واللسانیات بصورة عامة. نقترح الرجوع إلى الدراسة 
الحديثة 2 هذا الجال لصالح العصيمي, ۲۰۱۳. 


ج اکتساب اللغة وتعلمها وتعلیمها: 

۱- اکتساب اللغة الأولى والتطور اللفوي للأطفال: 

كانت دراسات النمو اللغوي للأطفال تعتمد على اللاحظات الشخصية 
لعدد محدود من الأطفال على مدی بضع سئوات 2 بعض الاحیان؛ فقد كانت 
محدودة من حيث العینات التي تخضع للبحث. أما مع 39 مدونات لغوية 
لالاف الاأطفال من آعمار مختلفة ax»‏ آصبح بالامکان دراسة الوضوع على 
نطاق آوسم. إضافة إلى |مکانات القارنة بين مئات الأطفال من عمر واحد 
أو آعمار مختلفة. مما يعطي للاستنتاجات مصداقية آعلی. كما يفيد ذلك 
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اذا ما آجریت الدراسة على مدونات للفات مختلفة أن نتعرف على ما 
يسمى بالظواهر اللغوية العالمية أو الکلیات اللغوية language universals‏ 
بصورة أدق وأفضل. لعل من أهم المدونات اللغوية لمثل هذه الدراسة باللغة 
الإنجليزية مدونة «CHILDES»‏ من إعداد قسم علم النفس .2 جامعة 
كارنيجي ميلون Carnegie Mellon;‏ 2 الولايات المتحدة الأمريكية ( انظر 
et al‏ ۰.3067 ۲۰۲-۱۹۹۸:۱۷۲) حیث يورد المؤلفون أمثلة على الدراسات 
التي أجريت على التطور اللغوي لدی الأطفالء ویذ کرون آمثلة على اللامح 
المميزة لکتابات التلامین مقارنة بالبالغین. 


۲- تعلیم اللغات: 

من آبرز نماذج الافادة من الدونات 4 تعلیم اللغات الساهمة .2 
اختیار محتوی المادة التعليمية (من مفردات وعبارات وتراکیب) و4 إعداد 
المراجع العجمية والنحوية. كما فعل الناشر کولنز Collins‏ 2 مجموعة 
الراجع البنية على مدونة COBUILD‏ تحت هذا السمی. يضاف إلى 
ذلك الاستخدام الباشر للمدونات 4 تعلیم مفردات اللغة وتراکیبها. بل 
إن هناك اتجاهاً حدیثاً 2 تعلیم اللغات یسمی النهج العجمي lexical‏ 
approach‏ 2 تعلیم اللغات یعتمد بدرجة كبيرة على الدونات اللغوية 
(انظر c Richards and Rogers‏ ۲۰۱۶) . ونود الاشارة إلى أن هناك کتاببن 
صدرا Nm‏ بعنوان: من الدونة الى صف الدراسة «.O’ Keefe et al)‏ 
۷ ) وآنماط نصية: الكلمات المفتاحية وتحليل المدونات فى تعليم اللغة 
.M. Scott and Ch. Tribble )‏ ۰۲۲۰۰۲۱ كذلك ± ت سوزان هنستون 
S Hunston)‏ (۲۰۰۲ الفصول V‏ و۷ و۸ من کتابها عن الدونات اللغوية 
وتان toti‏ 
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د- الترجمة والتحليل التقابلي وتحليل الأخطاء: 

-١‏ دراسات الترجمة: 

يمكن الافادة من المدونات المتوازية خاصة 2 دراسة خصائص لغة الترجمة 
والترجمین. وكذلك 4 دراسات المتقابلات 4 هذه المدونات. كما أن هناك 
ea‏ للاستفادة من هذه المدونات 2 تطوير برامج الترجمة الآلية LS)‏ 
فعلت شركة IBM‏ العروفة). حيث تدرس الاحتمالات الإحصائية للترجمات 
المتقابلة 2 هذه المدونات لتطبیقها 2 الترجمة الآلية. من أمثلة الدونات التي 
تتعلق بالعربية المدونة التي طورتها جامعة الكويت لهذا الغرض E-A Parallel‏ 
Corpus‏ «مدونة متوازية إنجليزية عربية» (انظر c Al-Ajmi. H‏ ۲۰۰). 
وكذلك المدونة المتوازية لنصوص الأمم التحدة: إنجليزي-عربي (انظر 
Hunston‏ . ۱۲۷-۲۰۰۲:۱۲۲؛ ۾ .(Y**£ «Olohan‏ 


:contrastive analysis التحليل التقايلى‎ -Y 
إجراء‎ comparable corpora من فوائد المدونات المقارنة أو المتناظرة‎ 
ويندرج تحته الدراسات القارنة‎ ۰ ۲۰۰۸ .Gilquin;Papp and Diez-Bedman 
بين اللهجات الختلفة. إضافة إلى المقارنة بين اللفات. وبين لغة المتعلمين ولغة‎ 

أهل اللغة الأصليين. 

۳- تحليل الأخطاء: 

قد يكون هذا المجال أول مجال 2 علم اللغة التطبيقي يستخدم النصوص 
التي ينتجها الدارسون وهو ما يسمى بمدونة المتعلمين „learner corpus‏ وهناك 
أعداد متزايدة من مثل هذه المدونات لدارسي اللغات المختلفة من غير أهلها 
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من خلفيات ومستويات وبيئات مختلفة. مما يتيح للباحث التعرف على الأخطاء 
الشائعة لدى الناطقين بلغة ما أو بلغات مختلفة. كذلك استنتاج التطور اللغوي 
لدى المتعلمين. وتحليل الأخطاء بطبيعته يعتمد على كال هذه الدوتات ساسا 
كما هو واضح من أي دراسة 2 تحليل الأخطاء 2 شتى اللغات (انظر المبحث 
الثاني من هذا الكتاب للتفاصيل حول هذا الموضوع) . 

ه- مجالات لسانية أخرى : 

-١‏ الأسلوبية: 
يذكر بايبر وزميلاه أن من أمثلة الدراسات الأسلوبية الدراسات التي 
تجرى لتحديد هوية المؤلف (المجهولة أو المشكوك فيها) بمقارنة النص 
بنصوص أخرى معروقة الوّلف. وكذلك الدراسات التي تهدف إلى التعرف على 
الخصائص الأسلوبية لبعض النصوص ,.Biber et al)‏ ۱۹۹۸:۲۲۳)؛ وانظر 
Crystal Lal‏ ۰۱۹۹۱ كما أن هناك فوائد المدونات 4 خدمة الکتاب لتحسين 
آسلوبهم 2 التعبير؛ إذ تذكر هنستون أن بعض الباحثين «استخدموا المعلومات 
الستقاة من مدونة عامة 2 تقدیم الشورة لکتاب الوثائق الرسمية الوجهة 
للقاریء العادي من حیث الاستعمال الأنسب للغة» ,Hunston)‏ ۲۰۰۲:۱۳۵). 
وجدير بالذکر أن هناك دورية تعنی بهذا النوع من الدراسات تسمی الحوسبة 
الأدبية واللغوية Literary and Linguistic Computing‏ وقد بلغت سنتها 

السابعة والعشرين 2# العام ۲۰۱۲. 

۲- الأيديولوجية (العقائد الفكرية) والثقافة وعلاقتهما باللغة: 

تناقش الباحثة سوزان هنستون Susan Hunston‏ .2 القسم العنون 
«دراسة الأيديولوجيا والتقافة «YYY-Y*A:Studying ideology and culture‏ 
من كتابها أمثلة لهذا النوع من الدراسات. حيث تقول: إن «المدرسة السائدة 
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.2 بحث العلاقة بين اللغة والعقائد (الأيديولوجيا) هی اللسانيات الناقدة 
critical linguistics‏ أو تحليل الخطاب الناقد critical discourse analysis‏ 
intervenes‏ 2 الجتمع. غالبا بترسيخ فرضيات وقيم ذلك المجتمع ...». وتذكر 
أن أحد رواد هذا النوع من الدراسات (قاولر («Fowler‏ دکر a5 M5 ela» gl‏ 
- دراسة النصوص .9 سياق الظروف الاجتماعية التى أنتجت فيها. 

- الكشف عن الأيديولوجية التضمنة implicitly coded‏ وراء الكلام 
والأفكار المذكورة صراحة .overt propositions‏ 

- تحدى الحس العام common sense‏ بالتنبیه إلى أنه كان بالإمكان أن 
fo‏ فا ماأمطريقة مخطفة لها Dada‏ جاك مف ةمول 2:94( 
(انظر كتاب سوزان هنستون .Hunston, Susan‏ ۲۰۰۲ حيث تناقش الباحثة 
المجالات المختلفة من اللسانيات التطبيقية التى تستفيد من المدونات اللغوية. 
وكذلك انظر مقال «المدونات اللغوية واللسانيات التطبيقية 2 McEnery et‏ 
(OYEYA ۵1‏ 

ولعل من al‏ الدراسات التي كتبت 2 هذا المجال عن اللغة العربية دراسة 
رجب جمعان الزهرانى (۲۰۱۳: :Alzahrani. Rajab Jamaan‏ ۰۲۲۰۱۳ والتى 
يقول 4# ملخصها: « تدرس هذه الأطروحة التمظهرات الأيديوجية ideological‏ 
595 لخطاب السلفى .2 السعودية من الفترة ۲۰۰۰-۱۹۸۰ 
وتحاول أن تجيب عن االسؤال التالى: ما مدى وشكل تجانس الخطاب السلفى 
2 السعودية -2 الفترة بين eT TAAS‏ 

:forensic linguistics اللسانيات الجنائية‎ -۳ 

من الجالات الطريفة 2 الافادة من الدونات «اللسانیات الجنائية 


«forensic linguistics‏ أى دراسة اللفة لأغراض قانونية وقضائية, مثل قضایا 
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التزوير وتحديد هوية المجرمين. وتذكر هنستون أن هناك حزمة برمجية تسمى 
CopyCatch‏ ( اضبط النسخ) تقارن نص «المشتبه بهم» بنص من انتاج غيرهم 
(النص الضابط (control text‏ . وتذکر أن فاينالي Finlay)‏ ۲۰۰۲) «تذكر 
عد ن اكاكس dg‏ سا auti‏ اوه من وی اها ك 
(Y Y: Y .Hunston)‏ وجدير بالذكر 4# هذا السياق ما آشار إليه كارل 
جيمس 4# كتابه عن أخطاء المتعلمين (144A James)‏ من أن تحليل الأخطاء 
اللغوية يمكن استعماله للغرض نفسه. 

و- دراسات ومشروعات اللسانيات الحاسوبية أو تطبيقاتها: 

lada E T‏ مرخ E‏ كان ا السك السانن 
الحاسوبي» كما هو واضح من الدراسات ذات الطبيعة الاحصائية ونظرية 
الاحتمالات. كما نجده 2 أعمال الحاسوبيين الذين يعملون على التعرف على 
الكتابة العربية. وكما هو الحال مع مدونتي CALLFRIEND. CALLHOME‏ 
للهجة المصرية اللذين كان الغرض منهما تطوير برنامج للتعرف على الکلام. 
ومدونة الحياة (Al-Hayat Corpus)‏ لأغراض الهندسة اللغوية واسترجاع 
المعلومات (انظر .Al-Sulaiti‏ ۰)۲۰۱۰ كذلك الأمر مع عدد من مشروعات 
الترجمة الآلية المبنية على الاحتمالات الإحصائية المعروفة 2 العالم. ويستطيع 
الباحث أن يلاحظ ذلك ب كثير من دراسات اللسانيات الحاسوبية (للأمثلة 
العربية ب4 هذا الجال. ينظر نبيل علي وعبد الغني آبو العزم والعناتي وجبر 
(۲۰۰۷) للدراسات المنشورة والتي قدمت 2 ندوات تعريب الحاسوب المختلفة ) . 
ويذكر الباحثان كيلغاريف وغرينفينستيت أن بوادر الارتباط الرسمي بين 
الدونات واللسانیات الحاسوبية برجم تسا إلى العام ۱۹۹۳ Kilgarriff,)‏ 


.(Y** Y «Adam and Grefenstette 
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اضدا: من المركر o‏ 
والايسمح بنشرغا ورقيا -— 8 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 
mm‏ بناؤها وطرائق الإفادة منها 


وقبل أن نختم هذا الفصلء أود التنبيه إلى أن أشمل مصدر للأمثلة المختلفة 
لدراسات لسانيات المدونات هو الجلة الدولية المعروفة باسم: المجلة الدولية 


.International Journal of Corpus Linguistics للسانيات المدونات‎ 


الخاتمة 

كما آشرنا من قبل 2 بداية هذا البحث فان الدونات اللفوية ولسانیات الدونات 
اللغوية حقل جدید نسبیا ك مجال العمل اللساني. وقد حاولنا ‏ هذا الفصل 
آن نلقي الضوء علی آهم جوانب هذا الوضوع. بدءاً بتعریف الدونات اللفوية 
مرورًا بلمحة عن طرق الافادة منها وأنواع الدونات اللغوية ومواصفاتها وانشائها 
ومتطلبات التعامل معها. ثم مناقشة تفصيلية لجالات الافادة من الدونات اللغوية 
4 فروع البحث اللساني العام والتطبيقي والحاسوبي مع التمثیل لكل فرع. 

والوضوع واسع تتطلب مناقشته كتابًا أو آکثر. لکن الغاية من هذا البحث هو 
استعراض عام لهذا الحقل من حقول العرفة لعله یکون تمهيدًا مناسبّا للکتاب 
الذي بين آیدینا والذي یعتبر رائذا 2 هذا الجال. 


قائمة یمدونات لغوية عربية 


$539 2341s ع‎ E cel TE all da US E | 


اسم المدونة إنتاج نوع اللغة الحجم الفرض مصدر الادة 

النصية 
مدونة باك - تم ولتر نصوص 0و ۳-۶ معجمي المصادر المنشورة 
ولتر العربية مكتوبة | بليون كلمة على الشابكة 
۲۰۰۳-۸۸ 


۷ 


مُدَوّنة ليوفان 


كول هوم 
۱۹۹۷ 


کلارا ۱۹۹۷ 


مصر ۱۹۹۹ 


جامعة بنسلفانيا 


جامعة بنسلفانيا 


جامعة بنسلفانيا 


جامعة جون 


هویکینز 


(واشنطن) 


قند ۱ ار وق 


اهداء من المركز 


و لا یسمع بنشرها ور قیا 


او نداو لها تحار پا 
ms‏ 


ومنطوقة 


محادثات 


محادثات 


۰ مليون 


"^ 


الترجمة الآلية 


مصادر من 
الشابکة, 
والاذ اعة 
والتلفاز» وکتب 
دراسة للمر حلة 


الإبتدائية 
وكالة فرنسا 
للصحف ووكالة 
شینخوا وأمة 
بريس 
ناطقون باللهجة 
المصرية 


مجلات وروايات 


ناطقون باللهجة 
المصرية 


الدوريات العلمية 

والكتب ومصادر 
من الإنترنت 
من ۱۹۹۵ حتى 


تاريخه 


مدونة ثنائية 
اللغة للقرآن 
الكريم 


قند ۱ انار وق 


إخداء من الرکز 
و لا یسمع بنشرها ورقيا 1 : 
أو تداء لیا تسار یا W‏ المدونات اللغوية العربية 
تج — بناؤها وطرائق الإفادة منها 
الأخبار | جامعة بنسلفانیا | منطوقة | ۱۱۰ برامج التعرف علی إذاعة صوت 
الاذ اعية وال دي سي اذاعية الکلام آمریکا 
e‏ 
Yes‏ 
مدونة جامعة نيميجن مكتوبة ٠‏ مليون | أغراض معجمية غير معروفة 
دینار۲۰۰۰ بهولندا كلمة ومعالجة اللغات 
وجامعة ليون الطبيعية عامة 
دو الفرنسية 
بالتعاون 
feri‏ 
سوتيتيل 
( التونسية) 
مدونة النهار | إي إل آرإيه مكتوبة | ۱۰۰ مليون أغراض بحثية صحيفة النهار 
Yes]‏ کلمة عامة اللبنانية 
مدونة الحياة | اي إل آرإيه مكتوبة 7 مليون هندسة اللغة صحيفة الحياة 
ey‏ كلمة واسترجاع اللبنانية 
المعلومات 
جيجا ورد | جامعة بنسلفانيا | مكتوبة | oglato‏ | معالجةاللغات | وكالة الأنباء 
العربية كلمة الطبيعية- الفرنسية, ووكالتا 
استعادة البیانات- آنباء النهار 
نمذجة اللغة TIU XP‏ ووكالة 
آنباء شينخوا 
مدونة جامعة الکویت مكتوبة | V‏ ملیون تدريس الترجمة | منشورات المجلس 
متوازية عر/ كلمة والعجمية الوطني الكويتي 
إنج ۳۹۶۲ 
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قند ۱ انار وق 
اخداء من المركر 
و یسم بنشوغا ور Lä‏ 
او تداو لیا تجاریا 
77 — 


جامعة مانشستر مكتوية 5 مليون | دراسة الرکیات 2 http://www.‏ 
العدسة kisr.edu.kw/‏ 
لعربي /science‏ 

جامعة مانشستر مكتوية ۵ مليون تحليل معجمى www.muhad-‏ 

dith.org and E 

www.alwaraq. 

com 
جامعة مانشستر | مكتوية | ۱۰۷ملیون الترجمة | صفحات تقنية‎ 
ملیون‎ ۱ 
عربیة)‎ 
سوتیتل لتقنية مكتوبة | ۸ملیون معجمي مواد أكاديمية‎ 
المعلومات كلمة آدبية ومجلات‎ 
(تونس) علمية‎ 
http://www.comp.leeds.ac.uk/latifa/arabic corpora.htm المصدر:‎ 
يضاف إلى المدونات المذكورة اعلاه المدونات التالية:‎ 

اسم المدونة إنتاج نوع اللغة الحجم o2 X3!‏ مصدرالمادة النصية 
الدونة مدينة اللك نصوص ۹ ۱ لأغراض | مصادر متنوعة قديمة 
اللفوية عبد العزیز مکتوبة مختلفة | وحديثة وتمثل مناطق 

العربية | للعلوم والتقنية SONS‏ جفرافية مختلفة 

(الرياض) 


شنه ۱ ار وق 


اخداء من المركر 
و لا یسمع بنشرها ورقيا 1 : 
أو تدار لیا تجار با Wl‏ المدونات اللغوية العربية 
تج — بناؤها وطرائق الإفادة منها 
المدونة مكتبة نصوص متوقع ٠٠١‏ أغراضن مصادر مختلفة 
العربية 
الدولية 
الذخيرة مها سليمان نصوص اه آغراض | مصادر ترائية مختافة 
النصية الربيعة مكتوبة مختلفة 
لجامعة 
الملك سعود 
مکنز صخر شركة صخر نصوص متوقع ۵۰۰ تطوير نصوص نثرية معاصرة 
مكتوبة مليون كلمة برمجيات 
حاسوبية 
لغوية 
مدونة جامعة أريزونا | نصوص تحليل كتابات دارسين آجانب 
متعلمى مكتوبة أخطاء على مدى ۱۵ عاما 
العربية المتعلمين 
مدونة وطن | مراد عباس نصوص معالجة | ٩۰۰۰‏ مقالة من الوطن 
Yt‏ مكتوبة اللغات 
الطبيعية 
مدونة خلیج | مراد عباس نصوص ١و٤‏ ميقا cob‏ | معالجة حوالى ٠٠٠٠١‏ مقالة 
Targ‏ مكتوبة اللغات من الخلیج 
الطبيعية 
الدونة جامعة نصوص | ۱۷۳,۰۰۰,۰۰۰ | آغراض | صحافة: أدب حدیث. 
العربية ara-‏ | بريغهام يونغ توبة مختلفة | نثر. عامية مصرية ... 
I » & biCorpus‏ كلمة 
i‏ (الأمريكية) | ومنطوقة 


الا 


شنه ۱ ار وق 
إهداء من المركز 


ولايسمح Li pisia‏ ورقيا 


أو تداولها تساريا 
mE." |‏ 
مدونة طه الزرو2 نصوص بحث لغوي وكيبيديا 
مسكوك (الجزائر) LI‏ العربية 
arab-)‏ متلازمات ومكتبة ثواب 
(crunch‏ لفظية 
المدونة حمودة نصوص ۱۳۷ بحث لغوي نصوص مترجمة 2 
التوازية الصالحی مكتوبة كلمة الأمم المتحدة 
(انجليزي- انجليزية 
عربی) ۳۷۵۵۷۱ 
کلمة 
عربية 


المصادر: 


www.aljabriabed.net/n31. O4abualazm.(2).htm 


mi‏ مدونتا الوطن والخليج, مرادعياس: 


http://sites.google.com/site/mouradabbasO/corporal 
مدونة «تونسية: مدونة العربية التونسية للباحثتين كارين ماكنيل وفايزة‎ 
Www.tunisiya.Org : ميلا د‎ 


مدونة العربية :arabiCorpus‏ 


http://arabicorpus.byu.edu 


مدونة كلمات: 


ww'w.lancs.ac.uk/staff/elhaj/corpora.htm 


مدونة متعلمي العربية: 


VY 


asia‏ ار وق 
إهداء من المركز 


و لا یسمع بنشرها ورقيا 


تست 8 المدونات اللفوية العربية 
تا — بناؤها وطرائق الإفادة منها 


http://I2arabiccorpus.cercll.arizona.edu 


(لزید من المعلومات حول مدونات متعلمي اللفة. ينظر المبحث الثاني من هذا 
الکتاب) 

مدونة مسکوك e‏ 2 الموقعين: 

http://arabcrunch.com/ar/ 


http://maskouk.sourceforge.net/index.php?contentzdoc 


مدونة نصوص الأمم المتحدة لحمودة الصالحي انظر: 
en.wikipedia.org/.../Engish-Arabic ^ Parallel Corpus of United‏ 
Nations, Texts‏ 


مدينة الملك عبدالعزيز للعلوم والتقنية (الرياض): 

http://www.kacstac.org.sa 

مها سليمان الربيعة (۱۶۳۲۳ه) الدليل المرجعي للذخيرة النصية الفصحی 
لجامعة الملك سعود: 


ksucorpus.ksu.edu.sa/ar/ 


كالكاء مدوكات»عربية ape‏ 
لعل من أهم المدونات العربية الموسومة ( أي بها تحشية صرفية ونحوية) ما 
e‏ 
(Y)‏ مدونة القرآن الکریم. وهي موسومة صرفياً ونحوياً ويها شبكة دلالية 
للمفاهيم ontology‏ وهي من إعداد فریق من الباحثين من جامعة 


ليدز (مجموعة البحث اللفوي ). وهي بك نسختها الرابعة -2 الأول 
من مايو .5*١‏ الموقع: http://corpus.quran.com‏ 


۷۳ 


قند ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او نداو لها تحار پا 
ود 


(۲) مدونة جامعة بنسلفانيا المشكولة والموسومة بأقسام الكلام والمحللة 
هیا هی adii‏ بان سین [issus dua. Lobos Saale‏ 
الأمريكية برئاسة محمد المعمورى؛ وتسمی :Penn Arabic Treebank‏ 
Arabic Treebank: Part 1 v 3.0 (POS with full vocalization +‏ 
syntactic analysis). Authors: Mohamed Maamouri (project‏ 
head), Ann Bies, Tim Buckwalter and Hubert Jin.‏ 

(Y)‏ مدونة جامعة كولومبيا الموسومة صرفيا ونحويا CATIB‏ وهي من 
Reem Faraj and Roth, Syntactic Annotation in the Columbia‏ 


Arabic Treebank 


CATiB: The Columbia Arabic Treebank (2009) : وكذلك‎ 
in: Proceedings of the ICL-IJNLP 2009 Conference Short 


Parpers. 

(۶) مدونة براغ الموسومة Prague Arbic Dependency Treebank lis‏ 
من اعداد فريق بحث 2# جامعة تشارلس Charles Universtiy‏ .2 
براغ Prague‏ وتشتمل المدونة على ۱۱۳ آلف وخمسمئة كلمة فعلية/ 
http://ufal.mff.cuni.cz/padt/PADT 1.0/docs/index.html‏ 


(o)‏ الذخيرة النصية الفصحى الموسمة: تذكر منشئة المدونة الباحثة 
مها الربيعة )2 ١‏ يونيو (T14‏ عن المدونة اللغوية المذكورة ما 
يلي: «هي نسخة من الذخيرة النصية الفصحى تحتوي على وسوم 
توضح الترويسة المعجميةء الجذع» الجدذر. الجنس والعدد لكل كلمة 


M 


alos‏ سار وق 
إهداء من jS A‏ 


ولايسمح بنشرها ورقيا 


عو سحو 8 المدونات اللفوية العربية 
تا — بناؤها وطرائق الإفادة منها 


من كلمات الذخيرة النصية. ( الدلیل المرجعى للذخيرة النصية 
الفصحى الموسمة: (Kksucorpus.ksu.edu.sa/ar/7p2117‏ . 


المراجع 
المراجع العربية 


آبو العزم عبدا لخني « اللغة العربية والمعالجة الآلية: برامج صخر نموذ جا») 
2 الوقع: eb) www.aljabriabed.net/n31 O4abualazm.(2).htm‏ الدخول 
۲ 


آبو العزم. عبدالغني (۱۹۹۸م). الحاسوب والصناعة العجماتية. 2: 
مجلة اللسان العربی. العدد ١٤ء‏ » صص ۲۹-۲۸ ۰ 


gi‏ الفتوح محمد حسين قائمة معجمية بألفاظ القرآن الکریم ودرجات 
شيوعها. بيروت: مكتبة لبنان. 


بايزيد» لیلی (۲۰۱۲) «الترابط النصي ذ المقال الموسوم (فتاة مهمة) 
لسليمان العودة بين الشكل والمضمون» 2 : دراسات 2 علم اللغة النصي: 
مقاربة تطبيقية على مدونة صحيفة الجزيرة (۲۰۱۲) الرياض: جامعة الأميرة 
نورة , .YA£-YAO‏ 


بن يشو جيلا لي «حوسية المعجم العربي: الواقع والافاق» 2: مجلة أرتين - 
المرجع الأول لطلاب الأدب. Art-En.com‏ ( تاريخ الدخول ۲۰۱۳/۲/۲۲) 


البواب» مروان (۲۰۰۹) آثر التقانات الحديثة 2 تجديد المعجم العربي 
(تاریخ الإضافة ۲۰۰۹/۳/۱۸) www.aluka.net‏ 


قند ۱ سار وق 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او نداو لها تحار پا 
ود 


البواب» مروان (۱۲ (Y:‏ محركات البحث 2 النصوص العربية. من بحوث 
www.aluka.net/ literature language/0/7728/‏ 

بوقرة. نعمان (۲۰۱۲) «استراتيجيات الإقناع .2 الخطاب الصحفى 
السعودی- دراسة نصية تداولیة» 2: دراسات .2 علم اللغة اللصی: مقاربة 
تطبيقية على مدونة صحيفة الجزيرة (۲۰۱۲) الریاض: جامعة الأميرة نورق 
ASA‏ 
على مدونة صحيفة الجزيرة. الریاض: جامعة الامت 3 نورة. 

الثبيتي. عبدالمحسن عبيد (Y**V)‏ «استخدام ذخائر النصوص 
لاستخلاص الصطلحات التخصصة» 2: الندوة الدولية الأولى عن الحاسب 
واللفة العربیة: الأوراق البحثية. صص ۰۲۸-۳۱ 

الثنيان» نوال (۲۰۱۲) «الإحالة الضمیریة- دراسة نحوية نصية» 2: 
دراسات -2 ele‏ اللغة اللصی: مقاربة تطبيقية على مدونة صحيفة الجزيرة 
(۲۰۱۲) الریاض: جامعة الأميرة نورق YAY- AY‏ 

الجلاب» محمد فتحي (۱۶۳۲ه) الاستخلاص الآلي للمحتوى العربي على 


شبكة الإنترنت بين الواقع والآمول. #: السجل العلمي لمؤتمر المحتوى العربي. 
صص ۰۸۰-۸۵۲ 


الحاج صالح عبدا لرحمن )^144( «ورقة حول مشروع الذخيرة اللغوية» 
2 مجلة اللسان العربی. العدد .٤۸‏ 


۷۹ 


شنه | حطی عم | 


اخداء من o 5$ A!‏ 
ولايسمح بنشرها ورقيا — 3 
أو تداو لها تجاریا WI‏ المدونات اللفوية العربية 
D DE‏ بناؤها وطرائق الإفادة منها 


الحلوة» نوال (۲۰۱۲) « أثرالتكرار 2 التماسك النصي- مقاربة معجمية 
تطبیقیة» _2: دراسات 2 علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة 
الجزيرة (۲۰۱۲) الریاض: جامعة الأميرة نورق ۰۱۹۰-۹۱ 

(able‏ سلوى «الدونات النصية ودور اللفة العربية 2 التعامل 
معها». 2 موقع: www.thomala.com‏ . تاريخ الحصول على الدراسة: 
۱ 

3 red "E 

حمادة. سلوی (۲۰۱۱) نحو منهج عربي مقترح لتصميم المدونات اللغوية. 
2 موقع: www.globalarabnetwork.com‏ ( تاريخ Jg ul‏ ۲۰۱۶/۱/۲). 

الحناش» محمد «برنامج لساني-حاسوبي للتعرف الالي علی التعابیر 
المسكوكة ب اللغة العربية» 2: مجلة التواصل اللسانىء ملحق سلسلة الندوات. 
المجلد Y‏ سنة NAAT‏ ص AA‏ 

دراسات 2 علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة الجزيرة 
(Y)‏ الرياض: جامعة الأميرة نورة. 

الربيعة» مها سلیمان (۵۱۶۳۲۳) الدليل المرجعي للذخيرة النصية 
الفصحى لجامعة اللك سعود. /ksucorpus.ksu.edu.sa/ar‏ ( تاريخ الدخول 
(Y /A/‏ 

الزرکان» محمد علي (۱۹۹۳) «اللسانيات و برمجة اللغة العربية 2 
الحاسوب». #: وقائع المؤتمر الدولي الأول حول اللفة العربية والتقنیات 
المتقدمة. الرياض. 8-39 7071 اي الرياض: مكتبة الملك عبدالعزيزء 
(el MAY‏ 00-. 


VN 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


سالم» ثناء محمد (۲۰۱۲) «الأبعاد التداولية للتعبيرالاصطلاحي» 2: 
على مدونة صحيفة الجزيرة. ۰۱۲۸-۱۷ الرياض: جامعة الأميرة نورة. 

السجل العلمی: مؤتمر المحتوى العربی 3 الانترنت: التحديات والطموحات 
(۱۶۳۲/۱۱/۷-۵ه) جامعة الإمام محمد بن سعود الاسلامية. الرياض. 
الجلد الثاني. الریاض: جامعة الامام محمد بن سعود الاسلامية. 

السجل العلمي لندوة استخدام اللفة العربية 2 تقنية العلومات النعقدة 
-2 مكتبة الملك عبدالعزیز بالریاض (۱۲-۸ /۱۱/ ۱۶۱۲ه). الریاض: مکتبة 

السجل العلمي لندوة تقنية العلومات والعلوم الشرعية والعربية النعقدة 
2 جامعة الامام محمد بن سعود الاسلامية ([۵۱۶۲۸/۲/۱۷-۱) الریاض: 

السلمان» عبدالملك ومنصور الغامدي وحسن الصبي (-àMEYA)‏ نظام 
حاسوبى لرومنة الأسماء العربية. .9 الندوة الدولية الأولى عن الحاسب واللغة 
العربية: الأوراق البحثية, 6١1؟5-/؟5.‏ 
المدونات أنموذ جا. الرياض: كرسى الجزيرة للغة العربية؛ جامعة الأميرة نورة. 

صوالحة مجدي «العنونة الصرفية والنحوية» .2 الموقع التالى: WWW.‏ 


.5١١١/١/١غ تاريخ الوصول‎ . com.leeds.ac.uk/sawalha/tagset 


صوالحة مجدي وارك أتول (۲۰۱۱) «التحليل الصرك لنصوص 
العربية الحديثة والكلاسيكية» http://www.comp.leeds.ac.uk/sawalha/‏ 
711100۸27 تاريخ الدخول ۲۰۱۶/۱۱/۲۰) 


V^ 


شنه ۱ انار وق 
إخداء من المركر 
والايسمح بنشرضا ورقيا 
al‏ تداو لیا تساريا 


الصويغ؛ علي سلیمان YAAV)‏ ( «کشافات اللصوص وتطبیقاتها -2 نصوص 
كشافات القرآن والحديث» 2: مجلة المكتبات والمعلومات العربية. س ۰۷ ع۰۲ 


.۵۲-۵ 


الصيني. محمود اسماعیل (۱۶۱۲ه۵). نحو معجم عربی للتطبیقات 
الحاسويية. 2: السجل العلمی لندوة استخدام اللغة العربية 2 تقنية العلومات 
النعقد ة 2 مکتبة اللك عبد العزیز بالریاض (۱۲-۸ /۱۱/ ۰/۱۶۱۲ ۵۱۱- 
۱۳۰ 
العارف. عبدا لرحمن بن حسن «توظیف اللسانیات الحاسوبية .2 خدمة 
الدراسات اللغوية العربية: حهود ونتائج» 2: مجلة مجمع اللغة العربية الآردنى. 
العدد ۰۷۲ 
عالیم. محمد (۵۱۶۲۸) العجم العربی .2 ضوء اللسانيات الحاسوبية. 
2: الندوة الدولية الأولى عن الحاسب واللغة العربیة: الأوراق البحثية, ۱۵۷- 
ANA‏ 
عبد العزيز محمد حسن» ومحمد يونس الحملاوي والمعتز au,‏ السعيد 
والتقنية -2 الرياض ( أبريل ۲۰۰۸). 
عبده. agla‏ عطية (۱۳۹۹) المفردات الشائعة 2 اللغة العربية. الرياض: 
جامعة اللك سعود ‏ 5ه 
العصيمي. صالح فهد ۳۳ (Y-‏ لسانيات المتون وعلوم اللغة. 2: مجلة كلية 
الآداب والعلوم الانسانية (فاس, الفرب) العدد ۰۱٩‏ السنة الخامسة والثلائون. 


۳-۳۷ 


۷۹ 


Wi‏ المدونات اللغوية العربية 


0 — بناؤها وطرائق البفادة منها 


قند ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او نداو لها تحار پا 
ود 


(quie‏ نبيل (۱۹۸۷( اللغة العربية والحاسوب: مجلة عالم osa‏ م ۰۱۸ ع 


علي. نبيل YAAA)‏ ( اللغة العربية والحاسوب. الكويت: مؤسسة تعريب. 
4 المجلس الوطني للثقافة والفنون والاداب. الكويت. (ینظر الفصل التاسع 

عمر» أحمد مختار (AAA)‏ البحث اللغوي عند العرب مع دراسة 2 التأثير 
والتأثر. ط1. القاهرة: عالم الکتب. 

العناتي. وليد وخالد الحیر (۲۰۰۷ دليل الباحث الئ اللسانیات 
الحاسوبية العربية. عمان: دار جریر للنشر والتوزیع. 

غازي, 3e‏ الدین (a YA)‏ قواعد العطیات العرفية للمصطلحية العربية: 
مشروع مقترح. 2: الندوة الدولية الأولی عن الحاسب واللفة العربية: الأوراق 
البحثية, ۲۰-۲۳. 

الغامدي عبدالله شرف و بدرية سلیمان الفرهود (۱۶۲۸ه) آداة ویب 
معتمدة على عملية التحلیل الهرمي للحصول على معجم عربي موحد لتقنية 
العلومات. 2: الندوة الدولية الأولى عن الحاسب واللفة العربیة: الأوراق 
البحثية, 0-١9‏ ه. 

الخامدي. متصور محمد «قاعدة بيانات الصوتيات العربية وقراءة الشفاه» 
www26.brinkster.com/mghamdi‏ ( تاريخ الدخول۲۰۱۵/۱/۲۰). 

قاید. وفاء کامل (۲۰۰۰) «بعض مظاهر تفیر الصیغ الصرفية 2 العربية 
المعاصرة» 2: بحوث الندوة الدولية للمعاجم اللغوية العامة والختصة ( المنعقدة 
ے الكويت 2 ۱۷-۱۶ مارس» ۱۹۹۹ )+ 


شنه ۱ انار وق 
إخداء من الرکز 
والايسمح بنشرضا ورقيا 
او تداوليا تجاريا 


قاید. وفاء كامل (Y: V)‏ التطلیات اللغوية لمعالجة التعابير الاصطلا حية 
العربية معالجة آلية. .2 الندوة الدولية الأولى عن الحاسب واللفة العربية: 
الأوراق البحثية, ۲۲-۱۱. 
العاصرة. القاهرة: د.ن. 

الفلاج. توال (۱۲ (Y:‏ «ظاهرة الاقتران الدلالی — دراسة معجمية تطبیقیة» 
4: التعابير الاصطلا حية 4 ضوء النظریات اللسانية الحديقة: دراسة تطبيقية 
على مدونة صحيفة الجزیرة. ۲۷۱-۷ . 

الفيفي» عبدالله يحيى (۲۰۱۲ ) المدونات اللغوية لمتعلمي اللغة العربية: 
نظام لتصنيف وترميز الأخطاء اللفوية. : السجل العلمبي للمؤتمر الدولي 
لعلوم وهند سه الحاسوب .2 اللغة العربية 2 45592 الثامنة YA-YX)‏ دیسمیر» 
۰1۲( جامعة القاهرة. 

القاسمي. علي محمد )3 Y»‏ لساننيات المدونة الحاسويية وصناعة 
۹۹ جم العربي. بحث قدم إلى المؤتمر السنئوي الخامس لجمع اللغة العربية 
بدمشق. ۲۲-۲۰. 

القحطاتي. سعد بن هادي «تحلیل اللفة العربية بواسطة الحاسب الالي» 
مجلة علوم “TAY diis e «AVI‏ (القاهرة: دار غریب). 

الکمار رأفت (۲۰۰۷) الحاسوب وميكنة اللغة العربية. القاهرة: دار الكتب 
العلمية للنشر والتوزيع. 

(e 9l‏ ماري- کلود (۱۲ (Y:‏ علم المصطلح: مبادئ وتقنیات. ترجمة د. ريما 


۸۱ 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


المالكي» رائدة وهند القحطاني (۲۰۱۲) «العلاقات الدلالية للتعبيرات 
اللسانية الحديثة: دراسة تطبيقية على مدونة صحيفة الجزيرة. ۰۱۷۷-۱۲۹ 

مراياتي. محمد. ويحي مير علم. ومحمد حسن طيان )1441( المعجم 

مهدوي» عمر (ayyy)‏ المقارية الحاسوبية للصرف العربی: فراءة 2 
الحصيلة والآفاق. 2: السجل العلمى لمؤتمر المحتوى العربی ۰۱۰۲۷-۹۹۹ 

موسی. علي حلمي وعبدا لصبور شاهین(۱۹۷۳) دراسة إحصائية لجذور 
تاج العروس. باستخد ام الکمبیوتر. الکویت: جامعة الکویت. 

موسى» علي حلمي (avi)‏ دراسة احصائية 23524 معجم الصحاح 
باستخدام الكمبيوتر. الكويت: جامعة الكويت. 

موسی» علي حلمي (YAVY)‏ دراسة احصائية لجذور لسان العرب 
باستخدام الكمبيوتر. الكويت: جامعة الكويت. 

موسی» علي حلمي (Yes)‏ «حوسية التراث العربی» محاضرة ألقيت 2 


مجمع اللغة العربى الأردنى 2 ۱۷ نيسان ( آبریل)» ۰۲۰۰۱ www.majma./‏ 
html.1-19-260/28-35-09-10-02-2009/org.jo/majma/index.php‏ (تاريخ 


الدخول ۲۰۱۲/۱۱/۹). 
موسى» علي حلمي (۲۰۰۷) آلفاظ القرآن الكريم: دراسة علمية تكنولوجية. 
القاهرة: الشركة المتحدة للطباعة والنشر والتوزيع. 


ندوة «استخدام الحاسوب .2 العلوم الشرعية» تحت اشراف مجمع الفقه 
الإسلامي ( ۲۱-۲۶ ربيع الآخرء ۱۶۱۱ه). جدة: البنك الإسلامي للتنمية. 


^Y 


قند dai‏ 
إخداء من الرکز 
و Y‏ یسمع بنشرغا ورقيا 
او تداو لیا تجاریا 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


الندوة الدولية الأولى عن الحاسب واللغة العربیة: الأوراق البحثية (۱۰/۲۹- 
۲ ۵ ۲ الریاض: مدينة اللك عبدالعزیز 
للعلوم والتقنية. 

النشرتي» مؤمن (۵۱۶۳۲) التحدیات التی تواجه محرکات البحث .2 
استرجاع المحتوى العربى على الإنترنت: دراسة تحليلية. 2: السجل العلمي 
لمؤتمر المحتوى العربی» ۰۸۱۶-۷۱۵ 

هلال» يحيى (۱۹۹۰) الحاسوب 2 خدمة الحديث النبوى الشريف. 2: 
ندوة «استخد ام الحاسوب .2 العلوم iae LA‏ ۰۲۶۲-۲۲۹ 

هلال يحي مختبر العلوماتية والعلاج الآلي للفة العربية. عرض لنشاط 
الدرسة الحمدية للمهند سین 2 الرباط. 

هلیل. محمد محمد حلمي (Y A)‏ «نحو معجم عربي معاصر» من بحوت 
الاجتماع الثانی لخبراء العجم الحاسوبی للفة العربية. الریاض: مدينة اللك 
عبد العزیر للعلوم والتقنیة. 

هلیل» محمد محمد حلمي وسعد مصلوح وحسان العجمي Yee)‏ 
تحرير) بحوث الندوة الدولية للمعاجم اللغوية العامة والختصة ۰( النعقدة 2 
الکویت .2 ۱۷-۶ مارس» 1444( الكويت: جامعة الكويت. 
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sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


alc‏ ار وق 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او نداو لها تحار پا 


المقدمة 

آثبتت الدونات النصية (Corpora)‏ منذ ظهورها قبل بضعة عقود قدرتها 
على اعادة الصياغة لنهجية البحث 2 کثیر من الجوانب اللفوية؛ وذلك نا 
توفره من امکانات 3928 Lu (ba‏ لادة البحث اللغوي الحدیث. هذا 
i obla aed ded sce ota‏ ال ی عا لأغراضها 
وطريقة بنائها. ومن ذلك ما يعرف يمدونات المتعلمين (Learner Corpora)‏ . 
وقد أضحت هذه المدونات احدی ركائز البحث 4 مجال اكتساب اللغة 
وتعليمها؛ لما تكشفه من دلالات على مستويات التعليم اللفوي. ومدى ملاءمة 
إستراتيجياته؛ ثم إن استخدامها انتشر بشكل كبير فبرزت عدة أنواع فرعية 
ذات آغراض مختلفة. مع تجاوز استخدامها للبحث 2 اكتساب وتعليم اللغة إلى 
مجالات أوسع كتأليف العاجم. ومعالجة اللغة الطبيعية. 


وقد ظهرت .2 الآونة الأخيرة بعض مدونات المتعلمين العربية. وبداً 
استخدامها 2 مجال تعليم اللغة العربية للناطقين بغيرها؛ فبات من الضروري 
الحديث عن هذا النوع ووضعه 2 مكانه الملائم» و2 هذا المبحث نستعرض 
بعض الاسس النظرية التي وضعها الباحثون مثل تعريف مدونات التعلمین 
وبيان أنواعهاء وما الذي يميزها عن غيرهاء مع استعراض المدونات العربية 
منهاء لينتقل الحديث بعد ذلك بشيء من التفصيل حول سبعة مجالات تمثل 
آهم النماذج التي استفادت - ولا زالت تستفيد - من مدونات التعلمین؛ وهي 
۱- أبحاث اكتساب اللغة وتعليمهاء ۲- التحليل التقابلي للغة المرحلية؛ ۳- تحليل 
الأخطاء بمساعدة الحاسب. ۶- دراسة التطور اللغوي لدى الطلاب. ۵- تأليف 
العاجم» -٩‏ ندرپس اللغة وتصمیم الواد التظيمية. وآخیرا: ۷- البخث. .ظ 
ا E nU‏ ی عن اتيك هخ dust) ilia]‏ رر بجا رورم 
الوسم (۱) (Tagging)‏ وقد اهتمت مدونات المتعلمين بوسم الأخطاء Error)‏ 
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تا — بناؤها وطرائق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
—— 


(tagging‏ أكثر من غيرها؛ لذا خصّصنا لذلك مبحثاً يشرح هذا النوع. 
ويستعرض الدراسات التي عنيت بوسم الأخطاء .2 اللغة العربية. مع الوقوف 
على بعض النماذج العملية لطريقة وسم الأخطاء. ونختم حديثنا 2 هذا البحث 
بمجموعة من المصادر العلمية لمن أراد القراءة بتوسع حول مدونات المتعلمين. 


Lo‏ هي مدونات المتعلمين؟ 

لا فرق من حيث البنية بين مدونات المتعلمين والمدونات العامة. ولذا فان 
تعريف قرانجر Granger‏ (۲۰۰۲) لمدونات المتعلمين - وهي أشهر من عرف 
هذا النوع - كان مبنیا على تعريف سينكلير Sinclair‏ (1595١م)‏ للمدونات 
العامة. إلا أن ما يميز بين هذين النوعين أمران: الأول أن مصدر البيانات 
لمدونات المتعلمين ينحصر .2 تلك المواد التي يحررها متعلمو اللغة دون غیرهم. 
بینما تجمع نصوص المدونات العامة من مصادر متنوعة. والثاني أن الغاية من 
بناء مدونات المتعلمين تدور 4 الغالب حول اكتساب اللغة وتعليمهاء 2 حين 
تستخدم المدونات العامة لأغراض عدة لا حصر لها. ومن هنا تعرف قرانجر 
مدونات المتعلمين بأنها: 

مجموعة حاسوبية من البيانات النصية الواقعية للفة الثانية أو الأجنبية, 
والتي تم جمعها Uns‏ لمعايير تصميم واضحة. ولغرض محدد بے مجال اكتساب 
اللغة الثانية. أو تعلیم اللغة الأجنبيةء ویتم وسم هذه النصوص بطريقة معيارية 
ومتجانسة. مع توثيق آصلها ومصدر الحصول علیها (قرانجر. ۲۰۰۲: ۷) 

وحتی یکون التمریف أکثر وضوحاء فسنشرح بعض مفرداته فیما يلي: 

حاسوبیة: القصود بکونها حاسويية أن تکون محفوظة # الحاسب الالي 
Moa‏ تينم قرا هذه ااتضومی LIT‏ فا هوات النصية ical‏ ی 
RR‏ وو خن ظريق لاش الضوق سار لاقب تحت هذا «Cassii‏ 
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واقعية: كونها واقعية يعني أن متعلمي اللغة أنتجوها 2 سياق طبيعي غير 
مصطنع. ولا بد هنا من التنويه أنه عندما يطلب من الطالب كتابة نص معين 
بغرض إدراجه 2 المدونة - أو الحديث عن موضوع معين سواء أكان 2 مقابلة 
al‏ محادثة آم عرض تقديمي el‏ غير ذلك مع تسجیله صوتیاً أو عن طريق 
الفیدیو - فان لغة الطالب لا تکون واقعية بشکل کامل كما لو كان یحادث احد 
زملائه < الفصل مكلا (قرانجر. 2۲۰۰۲). iUas‏ علی مقیاس نسلهاف 
Nesselhauf‏ ( ۸۲۰۰۶: ۱۲۸) الذي يتألف من آربع درجات: -١‏ نص طبيعي 
بشکل کامل. ۲- نص منتج من خلال عملية تعليمية. Y‏ نص منتج من خلال 
مهام تتم مراقبتها والتحكم بهاء ؛- وأخيراً برامج نصية ذات سیناریو محدد؛ 
فر الماحقة آن ous‏ | تم و asado ss‏ اقا کی تتا قت 
الدرجة الاولی. حیث إن منهجية تألیف الدونة تؤثر بشکل واضح 2 نوعية 
النصوص النتجة من الطلاب. فهي 2 درجة آقل من تلك النصوص الطبيعية 
الخالصة. 

معاییر تصمیم واضحة: يقصد بهذا تحدید العناصر الاساسية لبناء 
ia‏ وال شیم اليد شين ا callus s Cdi E‏ رهظ کر تزا 
على سبیل المثال: ۱- تحدید الطلاب الذین ستضم نصوصّهم للمدونة, ۲- نوع 
al gll‏ التي ستجمع منهم. ۳- تحدید نطاق الدونة (موسسة تعليمية. أو مدينة, 
أو دولة). ۶- تحدید حجم الدونة. 4- مع منهجية جمعها. — ووسمها. ولقد 
عالج البحث الثالث من هذا الکتاب موضوع تصمیم الدونات بتفصیل (AS‏ 
ولزید من الراجع انظر سینکلیر (۲۰۰۵). وقرانجر Yr Y)‏ و۲۰۰۳ب). 

وسم التصوص بطريقة معيارية ومتجانسة: يعد وسم النصوص آحد 
العناصر الرتبطة بشکل وثيق بالدونات النصية. ومن هذا النطلق لا بد أن 
یستند وسم النصوص 2 مدونات التعلمین على إحدى النهجیات العيارية 
المتبعة ‏ مثل هذه العملية. اضافة إلى آهمية تطبیق هذا النهجية بشکل 


44 


Wi‏ المدونات اللفوية العربية 


تا مده بناؤها وطرائق الإفادة منها 


هذه االظبعة 
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ود 


متجانس على جميع أجزاء المدونة. (للمزيد حول معنى الوسم - ومثله التحشية 
- انظر «سابعا: مصطلحات مهمة 2 مجال لسانيات المدونات» 2 المبحث الأول 
من هذا الکتاب) . 


توثیق أصلها ومصدر الحصول عليها: يقصد به المعلومات التي تؤخذ مع كل 
نص بغرض التوثيق وتسمى البيانات الوصفية للمدونة «(Corpus metadata)‏ 
أو ترويسة المدونة «(Corpus header)‏ ويعرفها برنارد Burnard‏ (۲۰۰۵: 4۰( 
Lob‏ «بيانات حول البیانات». أي معلومات إضافية حول نصوص الدونة. وهي 
-2 الغالب قسمان: الأول بياناتٌ حول مؤلف النص مثل عمره. وجنسه. ولفته 
الام. وجنسيتهء ومستواه الدراسي أو اللغوي. ومدة دراسته للغةء إلى غير ذلك. 
والقسم الثاني معلوماتٌ حول النص نفسه. مثل نوعه الأدبي (مقال. أو قصة, 
أو رسالة أو بحث). وشكله (مکتوب, أو منطوق) . ومكان وتاريخ تألیفه. وعدد 
کلماته. ونحو ذلك. 


بداية مدونات المتعلمین 

بدأت مدونات التعلمین مع ظهور «مدونة لونجمان للمتعلمین» Longman‏ 
Learners’ Corpus‏ ([شبكة مدونة لونجمان «Longman Corpus Network‏ 
(avs Y‏ التي بدأ العمل علیها # نهاية ثمانينات القرن الماضي» ومع ظهور 
مدونات آخری ب ذلك الوقت مثل بنك بيانات اللغة الثانية من مؤسسة العلوم 
الاو روبية ) (European Science Foundation Second Language Databank‏ 
التي تضم نصوصاً مسجلة لبعض الهاجرین الناطقین بلغات مختلفة. الا أن 
عدد العينة 2 هذه الدونة لم یتجاوز آربعة آشخاص. كما أن البیانات المستخرجة 
منهم لم تكن واقعية بل كان فیها درجة عالية من التوجیه؛ ولذا اعتّبرت مدونة 
غير معيارية مع آنها استوفت بقية معايير مدونات التعلمین کامكانية قراءة 
النصوص Lf‏ (نسلهاف, ۲۰۰۶م). استمر بعد ذلك انشاء مدونات التعلمین 


شنه dais‏ 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداو لیا تسا با 


على مدی العقدین الاضیین إلى أن فاقت المئة بحسب قائمة قرانجر لدونات 
التعلمین حول العالم (قرانجر. (e Y VY‏ اضافة إلى وجود عدد آخر منها لم 
یدرج بعد 2 هذه القائمة. وبعد هذا الانتشار لدونات التعلمین آصبح الکثیر 
منها مفتوح الصدر. يمكن تنزیل نصوصها والبحث فیها باستخد ام أي برنامج 
لتحلیل الدونات. مثل الدونة اللغوية لتعلمي اللغة العربية (الفيفي وآخرون 
(aY: ۱۶ .. Alfaifi et al‏ ومدونة التعلمین العربية لللصوص الکتوبة (فروانة 
وتميمي (aY: YY .Farwaneh and Tamimi‏ وبعضها متاح للاستخدام من 
خلال مواقعها الخاصة على شبكة الانترنت. مثل مدونة ميتشغان الأكاديمية 
للإنجليزية المنطوقة The Michigan Corpus of Academic Spoken‏ 
English‏ (سمیسون وآخرون Simpson et al‏ ۸۲۰۰۲). والمدونة الروسية 
لمتعلمي الترجمة Russian Learner Translator Corpus‏ ( سوسئينا 25050122 
۶ ومنها ما هو تجاري مثل مدونة لونجمان السالفة الذکر. وكذلك 
مدونة كامبريدج للمتعلمين i (e Y: \Y) Cambridge Learner Corpus‏ 
المدونة الدولية لمتعلمي اللغة الإنجليزية International Corpus of Learner‏ 


English‏ (قرانجر. ۲۰۰۲م ب). 


حدود مدونات المتعلمين 

مع اختلاف آنواع متعلمي اللغة فانه قد يشكل على بعض الد ارسین انا 
یمکن أن یدخل تحت مسمی مدونات التعلمین. فهل یشمل هذا النوعٌ النصوص 
التي حررها متعلمو اللغة وان کانوا من الناطقین بها ( الذین یدرسون قواعدها 
الاملائية والنحوية مثلاً)؟ أو آنها مقصورة على مواد من انتاج الناطقین 
بغیرها؟ ولا جاية على هذا السوال سنستعرض الأنواع الثلاثة التالية: 

الأول: مدونات لتعلمي اللغة باعتبارها لفة ثانية أو آجنبية. وهذا النوع هو 
القصود مباشرة بمدونات التعلمین. ومثال هذا النوع مدونة التعلمین التمهيدية 


RENEE 
بناؤها وطرائق الإفادة منها‎ nne تا‎ 


قند ۱ سار وق 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او نداو لها تحار پا 
ود 


للغة العربية sl)‏ حكيمة وآخرون. 8١٠7م):‏ وكذلك مدونة متعلمي العربية 
المكتوبة (فروانة وتميمي. 2۲۰۱۲). 

الثاني: مدونات جمعت بين النوع الأول اضافة إلى مدونات متعلمي اللفة 
الناطقین بها باعتبارها لفتهم الأم؛ وذلك بغرض القارنة بینهما. وهذا النوع 
یدخل Lad‏ ضمن مدونات التعلمین؛ وقد وجد الباحث عند دراسته لأكثر من 
مئة وخمسین مدونة من مدونات التعلمین (الفيفي, لم ينشر بعد) أن عشرین 
AMI 2‏ منها تندرج تحت هذا النوع. ومثاله الدونة اللغوية لتعلمي اللفة العربية 
(الفيفي وآخرون. ۲۰۱۶م). 

النوع الثالث: مدونات E‏ لتعلمي اللفة الناطقین بها باعتبارها لغتهم 
الام. وذلك مثل مدونات التعلمین العرب الذين يدرسون القواعد الإملائية 
والصرفية والنحوية للفة العربية. سواء أكان ذلك 2 مراحل التعلیم العام el‏ 
4 التعلیم الجامعي. بفرض دراسة السمات اللفوية لهذه الفثة مثلا. وذلك 
مثل مدونة لوفین للمقالات الانجليزية للناطقین بها (عبد الله ونور Abdullah‏ 
and Noor‏ ۲۰۱۳)؛ وهذا النوع من الدونات - استنادا على تعریف فرانجر 
(۲۰۰۲م) - لا یدخل ضمن مدونات التعلمین التي ترکز على اکتساب اللفة 
الثانية وتعلیم اللغة الأجنبية (ثودي Thoday‏ 2۲۰۰۷)؛ لکن مع ملاحظة 
ازدیاد عدد هذا النوع من الدونات. واشتراکها مع مدونات التعلمین .2 كثير 
من الخصائص dia‏ البتاء والأغراض, بل واشتراکهما آحیاناً ‏ مدونة واحدة 
كما هو الحال 2 النوع الثاني الآنف الذكرء فانها آقرب ما تکون إلى مدونات 
التعلمین منها إلى أي نوع آخر من الدونات. 


هذه الطبعة | 


إضداء من المركز B‏ 
و یسح بنشرها Leä ja‏ س z‏ 
أو تداء لیا تسار یا W‏ المدونات اللغوية العربية 
تا — بناؤها وطرائق الإفادة منها 


EP EPE EEE 
تشير قرانجر (۲۰۰۲م) إلى أن المدونات تصنف ب الغالب وفق ثنائيات‎ 
متقابلة. وسنأتي على أربع منها هي الأقرب إلى مدونات المتعلمين (الشكل‎ 
مع ملاحظة أن القائمة اليمنى من هذه الثنائيات هي الغالب على مدونات‎ ۱ 
المتعلمين الحالية.‎ 


أحادية اللغة ثنائية اللغة 


ڪڪ 


Bilingual Monolingual 


عامة 
H‏ 


Technical General 


ERE‏ تعاقبية (طولیة) 
Diachronic (Longitudinal) 1 Synchronic (Cross)‏ 
مكتوبة 


Written 


الشكل (Y)‏ أربع ثنائيات لتصنيف مدونات المتعلمين 

إن آغلب مدونات المتعلمين تندرج تحت المدونات أحادية (XUI‏ مع وجود 
عدد قليل منها ثنائية اللغة (مترجمة) مثل مدونة سبنس (e 44A) Spence‏ 
Lal‏ العموم والتخصيص هنا فيقصد به نوع المواد الضمنة ب الدونة, لا 
نوع المشاركين فيهاء والفرق بينهما أن مدونات المتعلمين تعد من المدونات 
المتخصصة مقارنة بالمدونات العامة؛ حيث تقتصر المشاركة فيها على متعلمي 
Des as si‏ اقوط ا E oar‏ قشر مد داف ب برو ده 
الى دوقة كات که عاف مره دای 38 اس ا تيزل Lagu‏ 


هذه الطيعة 
إخداء من الرکز 
ولايسمع بنشرها ور Led‏ 
او تداو لیا تسار با 
دك —— 


4 عدة مجالات مختلفة دون تخصیص. بينما الخاصة تركز على النصوص 
المكتوبة لأغراض محددة: كالسياسة؛ أو التجارة: أو الدين: على أن يكون ÉES‏ 
هذه النصوص من متعلمي اللغة. ومن هذا النوع الأخیر تصنف مدونة المتعلمين 
«اندیانا» للأعمال «(Indiana Business learner corpus)‏ التي جمعها كونر 
وآخرون (e Y: Y) -Connor et al‏ وکانت نصوصها محصورة 2 الأغراض 
التجارية. 


المدونة التزامنية هي تلك التي يتزامن جمع كل مادة أو جزء منها مع بقية 
انواد أن الاجزام الأخكيء آی آنها تجمع des Lait‏ والمرة دون EPE‏ 
1108 13 وقد قسمی كذلك مدوكة مرّصية أومقطديّق آما الدونة التعاقبية فتجمع 
آجزاژها على فترات زمنية متعاقبة. وتسمی أيضا طولیة(۲)؛ لأن موادها 
ie‏ بناء على خط زمني معین. آغلب مدونات التعلمین من النوع الأول وذلك 
لصعوبة متابعة عينة محددة من متعلمي اللغة لعدة أشهر وربما لبضع سنوات, 
الا أن هذا النوع الأخير مفيد لمراقبة وتحليل التطور الواقع بين كل فترة وأخرى. 
من المدونات التعاقبية المدونة السويدية لتطوير تعليم اللغة الثانية The ASU)‏ 
۵ التي جمعها هامر برغ )Hammarberg.‏ ١٠١٠م)‏ لتكون مادة لدراسة 
التطور اللغوي لكل طالب على حدة. أو بالمقارنة مع بقية الطلاب؛ ومنها كذلك 
مدونة اللغة المرحلية للمتعلمين الصغار The Corpus of Young Learner)‏ 
(Interlanguage‏ التي جمعها هوسن Housen‏ (۲۰۰۲م) بإجراء مقابلات 
مع ستة من متعلمي اللفة الإتجليزية, 23505 متهم ناطقون بالفرنسية 35555 
ناطقون بالهولنديةء وذلك لفترة زادت على ثلاث سنوات. 

یری كينيدي Kennedy‏ (2۱۹۹۸) أهمية اللغة المنطوقة لغلبة التواصل 
الشفهي بين الناس على التواصل الكتابي, ولكن عند مقارنة مدونات المتعلمين 
من حيث المحتوى المكتوب والمنطوق يظهر التفوق الكبير للمدونات ذات المواد 
الکتوبة. ومع أن ليتش Leech‏ (19917م) يقترح أن يكون الجزء المنطوق من 


alis‏ انار وق 
اخداء من المركر 
و لا یسمع بنشرضا ورقيا 
او تداو لیا تسا با 


alil سای على الآفل لسن او إلا آن الق 28 30 سم‎ gal] 
الصوتية وادخالها للحاسب یفسر سبب التفاوت الکبیر بين هذین النوعین.‎ 


ماذا یمیز مدونات المتعلمین عن غیرها؟ 

آشرنا 2 تعریف مدونات التعلمین إلى اثنتين من السمات التي تمیزها عن 
Brit esatta lef‏ كاه نایدا eds‏ و اق 
مع إضافة سمتين أخريين أقل منهما درجة 2 التمييز بين مدونات المتعلمين 
وغيرها من المدونات. 

تن E‏ ناف لج توس T E E‏ ها توس LEE‏ 
تقتصر مدونات المتعلمين على المواد التي ينتجها متعلمو اللغة دون غيرهم, 
من نصوص مكتوبة أو أحاديث منطوقة؛ وقد تتنوع هذه المواد ما بين بحثء أو 
رسالة. أو قصة. أو مقال. أو كلمة تلقى مشافهة. أو |جابات ‏ مقابلة مع معلم 
أو زميل دراسة. أو آداء لأي مهمة لغوية تطلب من الطالب. وتجدر الإشارة هنا 
إلى أهمية أن تكون المواد المجموعة من الطلاب موحدة. أي تمثل أحد الأنواع 
السابقة. اما لكامل المدونة أو لكل مدونة فرعية منهاء والا كانت النتيجة خليطاً 
من البيانات المختلفة التي لا يمكن الاستفادة منها أو تعميم النتائج عليها 
(قرانجرء 2۱۹۹۳). 

الغرض: يمكن ملاحظة أن اكتساب اللغة وتعليمها يمثلان الغرض الرئيس 

الذي تدور حوله مدونات التعلمین pagi)‏ ۲۰۰۷ع). ومع أن هناف آغراضا 
أخرى هن انض من ا النوع يكل يوان سس الأخطاء ان نظ مجان 
اللغويات الحاسوبية (انظر مثلاً زغواني وآخرين (aY: ۱۶ «.Zaghouani et al‏ 
إلا أن غالبية المدونات الحالية والأبحاث المبنية عليها تعكس الاهتمام الواضح 
بمجال تعليم اللغة واكتسابها. 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطراثق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


الوسم: آشکال الوسم التي يمكن استخدامها 2 الدونات النصية كثيرة 
ومتنوعة. الا أن مدونات التعلمین تتمیز بنوع خاص من الوسم. وهو وسم 
الأخطاء اللفوية. کونه آحد الأركان الأساسية التي تعتمد علیها بعض الأبحاث 
القائمة على مدونات التعلمین. وسنورد بشيء من التفصیل بعض هذه الأبحاث 
عند حدیشا عن طرق الاستفادة من مدونات التعلمین. كما سنفرد الحدیث عن 
وسم الأخطاء 2 جزء آخر من هذا الفصل. 

الحجم: مع آهمية حجم الدونة باعتباره آحد العناصر الرئيسة .2 تمثیل 
اللفة. إلا أن مدونات التعلمین ذات حجم صغير 2 الغالب. وأكثرها يقل حجمه 
عن اللیون كلمة. آما آکبرها فيحوي ما یقارب YO‏ ملیون كلمة مثل مدونة 
کامبریدج للمتعلمین (۰)2۲۰۱۲ ومدونة جامعة هونج کونج للعلوم والتکنولوجیا 
( میلتون ونانديني Milton and Nandini‏ ۱۹۹۶م. وبر افيك Pravec‏ °0۲ م)› 
وکلاهما لتعلمي اللغة الانجليزية. وتری قرانجر (۲۰۰۳م ب) أن مدونة مكونة 
من مّتي آلف كلمة لاستخدامها 2 مجال اکتساب اللغة الثانية تعد كبيرة اذا 
ما فار اها بالمینات البحثية الصغيرة التي یمتمد علیها الباحشون عادة .2 هذا 
الجال؛ لکنها 2 القابل تعد صغيرة بالنظر إلى ما هو مستخدم 4 الجالات 
اللفوية الأخری. حيث یعتمد الباحثون على مدونات تتکون من مثات اللایین 
وربما ملیارات الکلمات. خصوصا آن مكل هذه الآرقام الكبيرة آصبحت معيارا 
لقارنة آحجام الدونات بعد أن كانت استثناءً 2 بداية نشأتها. كما أن هذا الرقم 
الذي ذكرته قرانجر - ۲۰۰,۰۰۰ كلمة - هو ما اعتمدته .2 المدونة الدولية 
لتعلمي اللفة الانجليزية کحد آدنی لكل واحدة من الدونات الفرعية التي تمثل 
مجموعة من الطلاب المتحدثين بلغة al‏ واحدة (انظر قرانجر. ۲۰۰۳م I‏ 


مدونات المتعلمین العربية 
إن abad‏ عاق شارب ETE‏ ما اسان رات odas]‏ 9 سکن 
أن Ghas‏ عينه ما تحظى به اللغات الأجنبية. واللغة الإنجليزية على وجه 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


الخصوص ( الفيفي. لم ينشر بعد) . من نصيب 2 هذه المدونات؛ فبعد دراسة 
لأكثر من Aa‏ وخمسين مدونة 2 هذا الجال, وجد الباحث أن اللغة الإنجليزية 
تدخل .2 ۸۵۲ منهاء بينما كان نصيب اللغة العربية ۸۳ فقط ( خمس مدونات 
فقط) . ولكن عند إمعان النظر 2 هذه المدونات الخمس نجد أن وتيرة الاهتمام 
بهذا النوع متسارعة وان بدأت متأخرة, وهذا ینم عن الحاجة الكبيرة لدونات 
التعلمین لما آثبتته الأبحاث القائمة علیها من فوائد علمية وعملية. 

وقبل أن نورد معلومات حول مدونات التعلمین العربية. فانه من الستحسن 
أن تيوت Lagu,‏ لاف المهتمين بجانب التصمیم وجمع البیانات لهذا النوع 
- إلى واحدة من آفضل الامثلة على مدونات التعلمین. وهي الدونة الدولية 
لمتعلمي اللفة الانجليزية ) (International Corpus of Learner English‏ › التي 
آشرفت على بنائها رائدة البحث ب هذا الجال سیلفیان قرانجر من جامعة 
لوفین ببلجيكا (انظر قرانجر. ”7١٠٠م‏ ب)» وتعتبر هذه الدونة 4 نظر کثیر 
من الباحثين مدونة معيارية لا تتمتع به من تصمیم دقیق. اضافة إلى الحتوی 
النصي الذي شارك 4# جمعه عدد کبیر من الباحثین حول العالم. وقد تطورت 
النسخة الثانية من هذه المدونة لتضم ثلاثة ملایین وسبعمئة آلف كلمة لنصوص 
حررها متعلمو اللفة الانجليزية 2 عدد من الدول. یمتلون ست عشرة لفة آم. 
Ld. dol d‏ غا ا الخائقة Gf Lats‏ بالنسمة alga adl dal‏ 
خمس مدونات لمتعلميها تتفاوت من حيث الحجم والخصائّص, وفیما يلي نبذة 
موجزة حول كل منها. 

المدونة الأولى: مدونة غازي آبو حكيمة وآخرين 

۱ اسمها: مدونة المتعلمين التمهيدية للغة العربية — The Pilot Arabic‏ 


Learner Corpus 


؟. حجمها: 5٠٠١‏ كلمة 


0 ا‎ ETN 
تا — بناؤها وطرائق الإفادة منها‎ 


١ 


قند ۱ سای وق 
إخداء من الرکز 
ولايسمع بنشرها Led pg‏ 
او تداولها Le dum‏ 
بود 


. المواد المشمولة فيها: نصوص مكتوبة 
. الطلاب المشاركون فيها: متعلمو اللغة العربية باعتبارها لغة أجنبية 2 


الولايات المتحدة الأمريكية 


. الوسم: غير موسومة 


. نشر المدونة للباحتین: المدونة لا زالت فيد التطوير وهي غير متاحة 


(aY ** A) .Abuhakema et al المرجع: أبو حكيمة وآخرون‎ . 


المدونة الثانية : مدونة سميرة فروانة ومحمد تميمي 


١ 


. اسمها: مدونة متعلمی العربية المكتوبة - Written Arabic The L2‏ 


Corpus 


3a ۳۵۸۵ حواك‎ 


. المواد المشمولة فيها: نصوص مكتوبة 
. الطلاب المشاركون فيها: متعلمو اللغة العربية باعتبارها لغة أجنبية 2 


الولايات المتحدة الأمريكية 


. الوسم: غير موسومة 


" نشر المدونة للياحثين: المدونة متاحة على شكل ملفات PDF‏ فقط. ويمكن 


تنزيلها من موقع الدونة http://I2arabiccorpus.cercll.arizona.edu‏ 


. المرجع: فروانة وتميمي (2۲۰۱۲) (انظرالشكلين ۰۲ (Ys‏ 


هذه الظبعة 


|اهداء من المركز 


ولايسمح بنشرها Là ja‏ 
أو تداو لها 3 ارپا W‏ المدونات اللغوية العربية 
جح — بناؤها وطراثق الإفادة منها 
Best Lecture Author 6 L1-Spanish Advanced 4* Year Spontaneous Narrative/Opinion‏ 


من وجهة نظري كانت محاضرة الدكتور زيدان أفضل محاضرة حضرتها هذا الفصل. تكلم الدكتور 
زيدان فيها عن ظاهرة تغير المناخ ولا سيما عن مشكلة الاحتباس الحرري» وحسب الاستاذ زيدان سبب 
هذه المشكلة هي الأنشطة البشرية مثل التلوث البيني» وفي تقديمه استخدم صور ممتعة جداً ولقدم 
معلومات مهمة ومشوقة. اضافة إلى ذلك يستخدم الدكتور لغة بسيطة وواضحة وخير دليل على ذلك هو 
أنني فهمت على الأقل 9690 من التقديم. 

في رأي مشكلة الاحتباس الحرري هي مشكلة جدية ولا بد من أن تتفهمها قبل أن يكون متأخراً. ولذا 
يجب علينا أن نخطط منهجاً لتعليم الجغرافية وعلم البيئة في المدارس لأن المدارس اليوم تهتم فها أقل 
مما ينبغي وترتكب خطا كبيراة إذا لم egal‏ عن ذه المشكلة. كل همي الأن أن نطور جيلاً يهتم بالبيئة 


والمجتمع. 


Best Lecture Author6  L1-Spanish Adv.4™ Year. Spon. Narr/Opin 


الشكل (Y)‏ نموذج call‏ نصي مع البيانات الوصفية من مدونة المتعلمين العربية 
للنصوص المكتوية 


۱۰۹ 


dI, THE University 


(incu. 


iuis View Files 


المدونة الثالثه : مدونة حسلينا حسان ومحمد alga‏ محمد غالب 
۱ اسمها: المدونة الماليزية لمتعلمى العربية - Malaysian Corpus of‏ 
Arabic Learners‏ 
aN‏ حجمها: حوالی ۰ کلمة تقریبا 
aada‏ إلى +۷8 قضاء متوسظ طول الت 3x foral‏ 
؛. الطلاب المشاركون فيها: متعلمو اللغة العربية الماليزيون ب2 المستوى 
المتقدم 
۵ الوسم: غير موسومة 
لكن المؤلفة تنوي إدراجها مستقبلا ضمن مدونة أكاديمية أوسع يمكن 


شنه daiat]‏ 
إهداء من المركز 


ولايسمح بنشرها ورقيا 


منت ٩‏ المدونات اللفوية العربية 
تج — بناؤها وطرائق الإفادة منها 


الوصول الیها عن طریق العنوان التالی: http://efolio.iium.edu.my/‏ 


arabicconcordancer 
(Y: Ww) المرجع: حسان وغالب‎ ۷ 
المدونة الرابعة: مدونة محمد الكنهل وآخرين‎ 
اسمها: مدونة تصحيح الأخطاء الإملائية‎ .١ 
حجمها: ۱۵۰۰۰ كلمة‎ ۲ 


اراد تیوه يهاه aoa‏ کیت يدوا من قل alice‏ امات 
بعد ذلك إلى الحاسب الآلى بواسطة نساخ مستقلين 


۶ الطلاب المشاركون فيها: مجموعتان من الطلاب الجامعیین. كل 
مجموعة من جامعة مختلفة دون تحديد للتخصصات أو الستویات 


0. الوسم: هناك نسختان لهذه الدونة. الأولى ملفات نصية (txt)‏ وهي غير 
موسومة. والثانية قاعدة بیانات (مایکروسوفت Microsoft — gauk‏ 
Access‏ تم تصحيح الأخطاء فيها Ke‏ 


1. نشر المدونة للباحثين: يمكن تنزيل نصوص المدونة على شكل ملفات 
نصية من الرابط التالی: cri.kacst.edu.sa/Resources/TST DB.rar‏ 


. المرجع: الكنهل وآخرون et al‏ ۰۸1۵2۵1 (2۲۰۱۲) (انظر الشكل £( 


العنوان:أتر التدخين فى الاماكن العامه وعيره نعم: لان التدخين ضار بي صحه المدخن ولاذلك لضرر التدخين بي الناس وله أمراص كثيرة: سرطان 
الرئه وعيره من الأمراض. ولذلك منعة بعض الدول الكبير هذه الشائعه التي ثثر على المجتمعات الكبير وتئثر على قوة بناء المجتمع . هل تعتقد أن 
مجتمع انتشار فيها التدخين تكون أمر سليمه وشبابه صالحین؟. أن من يذخن أمام صديق له قد يكون الضرر الصديق أكثر من المدخن وأثبت في 
بعض الت جارب علی المدخن ومن یجلس آمام المدخن اکتشف أن أثر التدخين أكثر على الصديق الي يجلس دائما مع المدخن. لذلك منعه أكبر الدول 
التدخین في الأماكن العامه والمکاتب لأن: أكثر الأماكن التي يكون فيها التدخين السالبي؛ أو (السلبي) كما في الفقر التي قبلها وهو تحارب الکلم بين 
المدخن والشخص الغير مدخن. ومن سبب منع التدخين في الاماكن العامه والمکاتب» تشبه بعض الناس في الأقتداء فى المدخنين وفعل مايفعلون( 
شرب الدخان) واذكر قصه بي اختصار يو جد رجل جا ثر مرض السرطان الرئه بسبب مصاحبه لأصدقاء يشربوا الدخان ف أصبح كأن يد 
خن معهم وهذا أخر منيجلس مع المدخنين لذلك منع الدول السليمه. وفي الختام اذكر ان كل مجتمع سليم يبي على الشباب فإذا فسد الشباب فسد 
المجتمع ولذلك ننضر إلى التدخين انه (الموت البطيء ) لان الشباب أكبر فئه يشربوا التدخين فإذا أصبح الشاب مريص فقد تصبح الأمه في عجز 

وكل مايضن بي الشباب والناس يمنع في كل مكان. sw‏ 


الشكل )£( نموذج لملف نصي من مدونة الكنهل 


شنه ۱ سار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 
ود 


المدونة الخامسة : مدونة عبدالله الفيغي واريك أتويل 


١ 


۲ 


. اسمها: الدونة اللغوية لتعلمی اللغة العربية - Arabic Learner Corpus‏ 
. حجمها: ۲۸۲,۷۲۲ كلمة 


. المواد المشمولة فيها: نصوص مكتوبة يدوياء وأخرى باستخدام الحاسب. 
وكذلك مقابلات صوتية مسجلة؛ تدور جميعها حول موضوعین. الأول 


. الطلاب المشاركون فيها: متعلمو اللغة العربية الناطقون بغيرها ويمثلون 
۷ من محتوى الدونة. إضافة إلى طلاب ناطقين بالعربية يمثلون 
۳ وهم من كلا الجنسين (الذكور AIV‏ والإناث (A0‏ يدرسون 
8 عدد من المدارس الثانوية ومعاهد اللغة وجامعات المملكة العربية 
السعودية. وتتفاوت أعمارهم بين V‏ و ۶۲ سنة. 

ال ا Ld do qct]‏ كير سومان کات ا 
نسخة تشمل وسم الأخطاء اللغوية. هناك نسخ إضافية من المدونة على 
بعض مواقع البحث. وهي مبينة بالتفصيل على موقع المدونة المذكور 
أدناه. 

. نشر المدونة للباحثين: يمكن تنزيل نصوص الدونة 2 ملفات نصية 
(txt)‏ أو ملفات بلغة الترميز الممتدة (xml)‏ إضافة إلى الأصول 
المكتوبة يدوياً ج ملفات (pdf)‏ وكذلك التسجيلات الصوتية ‏ 
ملفات (mp3)‏ من خلال موقع المدونة على الرابط التالي: 


http://www.arabiclearnercorpus.com 


. المرجع: الفيفي وآخرون (2۲۰۱۶) (انظر الشكل 150( 


قند ۱ ار وق 


اهداء من المركز 


و لایسمع بنشرها Leä ja‏ 
او تداو لیا تسا با 
مهد 


$319 T1 M Pre NNAS W C: رمز النص‎ 


معلومات الطالب 

العمر :۲۰ 

الجنس :ذکر 

الجنسية :نيجيري 

اللغة الأم :اليوربا 

أصالة اللغة :ناطق يجين الصا 
aac‏ اللغات التى يتحدثها :۳ 

عدد سنوات تعلم اللغة العربية ٠١:‏ 
عدد السنوات فى بلدان عربية ٠١:‏ 
المرحلة العامة :ما Ja‏ الجامعة 
المرحلة الدر اسية :برنامج الدبلوم 
السنة/المستوی :المستوی الثاني 
المؤسسة التعليمية :معهد اللغة بجامعة الامام 


ual معلومات‎ 

النوع :سردي 

مكان التأليف :في الصف 
سنة التأليف ۱۳۵۰ 
دولة التأليف :السعودية 
مدينة التأليف :الرياض 
محدد بوقت :نعم 

استخدام مراجع :لا 
استخدام كتاب قواعد :لا 


da‏ :مكتوب يدويا 
لطول :۱۷۸ كلمة 


عنوان النص :رحلتي إلى لاغوس. 
انض : 


WI‏ المدونات اللفوية العربية 
بناؤها وطرائق الإفادة منها 


عرفت أنني سأسافر إلى لاغوس . عاصمة نيجيريا سابقاء في رمضان لام الناس في صلاة التراويح والتهجّدء ولكن 
لأعمال الكثيرة التي كانت على عانقي والتي تلزمني التخلص منها تكاد تنسيني وتمحو السفر عن ذاكرتي .كنت أدرّس 


بعض الطلاب في إحدى المدارس في مدينة إيوو ولاية أوشن ومما طلب مني إخراج الأسئلة لهم في الإختبار النهائي 
وفعلت كما طلبواء وفجأة جاءت الأوراق للتصحيح بدأت بتصحيح الأوراق لثلاث مواد درّسهاء وقبيل المغرب تذكرت 
أنني سأسافر إلى لاغوس لأن ذلك اليوم هو التاسع والعشرون للشعبان .ماذا أفعل والأدوات مازالت كثيرة وكأنني لم 
أصحح منها شيئا أو إضافة إلى ذلك ما جهزت للسفر ولا استحمَمْتُ من كثرة الأوراق التي أصحَح جاءتني فكرة أن 
أعطي الأوراق لواحد من الإخوان ثم جهّزت للسفر وتوجهت إلى لاغوس .وصلت إلى المكان الذي أقصده الساعة 
العاشرة ولكن | لحمد لله أن الهلال ما طلع في أي مكان ومعنى ذلك أن صلاة التراويح تبدأ في اليوم التالي .بدأنا التراويح 
في ليلة الثلاثين axe‏ غفير من الناس والبهجة والسرور ما اختفيا في أوجههم لأنهم -فضل الله تعالى -شهدوا رمضان 


عام الفين وثلائة عشر مبلادیاء أشهر الرحمة والمغفرة وعتق من النار 


الشكل (۵) نموذج لملف نصي مع البيانات الوصفية من المدونة اللغوية لتعلمي اللغة العربية 


yr 


mE له‎ 


المدونة اللغوبة ç olal‏ اللضة الصرببة 
ARABIC LEARNER CORPUS ALC‏ 


تنزيل ملفات المدونة 


mem‏ ملفات نصية دون المعلومات 


الشكل (1) موقع المدونة اللغوية لمتعلمي اللغة العربية 


مجالات الإفادة من مدونات المتعلمين 

تعد مدونات المتعلمين المصدر الرئيس للبيانات 9 كثير من الأبحاث اللغوية, 
حيث قدمت وسائل وأساليب جديدة للبحث أسهمت 2 الحصول على نتائج 
أكثر دقة وواقعية. إضافة إلى النتائج العلمية والعملية المستفادة من دراسة 
وتحليل المفردات والتراكيب اللغوية 2 مدونات المتعلمين (شابلء ۱۶۲۸ه)؛ وقد 
aa‏ المبحث الأول من هذا الكتاب للقارئ بعض الأمثلة على استخدام المدونات 
2 البحث اللغوي؛ لذا لن نبسط الكلام هنا عن الوسائل والأساليب بقدر ما 
سنركز حديثنا حول المجالات التي لعبت مدونات المتعلمين فيها دورا ملموسا 
مما أدى لتطورها بشكل واضح عما كانت عليه 2 الماضي. 


أو 5 : الأبحاث 2 مجال اكتساب اللغة (Language Acquisition Research)‏ 


بناء على الدراستين اللتين أجرتهما قرانجر (۱۹۹۸م و 2۲۰۰۲) حول 
استخدام مدونات المتعلمين # أبحاث اكتساب اللغة فقد وجدت أن هذه الأبحاث 


YN 


قند ۱ انار وق 
اخد!ا: من الرکز 
و aas‏ بنشرضا ور Led‏ 
او تداو لها تحار پا 


cab‏ تعتمد بشکل متزاید على هذا النوع من الدونات. وآن هذا التوجه يرجع 
إلى الأفق الواسع بج الامکانات والأفکار والرژی التي توفرها مدونات التعلمین 
لهذ الحقل الحيوي. الذي یهدف بشکل رئيس إلى فهم آلية اکتساب اللغة الثانية 
أو الأجنبية؛ اضافة إلى ذلك فان هذه الدونات - رغم بعض العوامل التي قد 
تؤثر على نتائجها كما يرى ييب Yip‏ (١۱۹۹م)‏ - تعطي صورة آشمل لبحث 
جوانب لم يكن بمقدور الدراسات السابقة النظر فيهاء ومن ذلك إمكانية دراسة 
الأشكال اللفوية التي قد cla nt‏ تاونس سور امن اقم 
فيختارون تفاديها والالتفاف عليها من خلال أساليب لغوية آخری. قد تسبب 
إطناباً واضحاً 2 غير موضعه. 

إضافة إلى ذلك فإن مدونات المتعلمين تمثل أحد أنواع البيانات البحثية التي 
يمكن من خلالها دراسة اكتساب اللغة. حيث قسم اليس (a ^£) Ellis‏ هذه 
البيانات إلى ثلاثة آنواع. -١‏ الاستخدام اللغوي: وهي تلك البيانات والنصوص 
التي تعكس استخدام الطلاب للغة الثانية. سواءٌ أكانت من ناحية الفهم 
والاستيعاب al‏ من ناحية الانتاج؛ ۲- الأحكام اللغوية: وهي الآراء التي يصدرها 
الطلاب حول اللغة الثانية. كان يطلب منهم الحكم على جملة لغوية من ناحية 
التركيب النحوي؛ ۳- التقارير الذاتية: ويقصد بها ما يقدمه الطلاب من 
معلومات حول إستراتيجياتهم اللفوية عن طريق الاستبانات أو مهام التفكير 
المسموع ونحوهما. وبالرجوع إلى النوع الأول يقسم إليس «الاستخدام اللفوي» 
إلى صنفین. يطلق على الأول منهما بيانات طبيعيّة ب4 حال لم يتم التحكم 
.2 أداء الطلاب عند الحصول علیها. وهذا ما تمثله إلى حد كبير مدونات 
التعلمین. ويمثل الصنف الثاني البیانات المستنطقة إن كانت نتيجة لمهام مقيدة 
أو أنشطة لغوية ذات رقابة. و4 حين أن الصنف الثاني يقدم معلومات أكثر 
تركيزا للجانب المطلوب دراسته فإن مدونات المتعلمين تفتح المجال لدراسة كثير 
من الجوانب 4# نفس الوقت (نسلهاف. 5١٠٠م).؛‏ مع إمكانية دراسة العلاقة 


rJ 


Wi‏ المدونات اللفوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه الطبعة 
اشت! Š‏ ۱۹ المركر 
والايسمح بنشرضا ورقيا 
او تداولها تسار با 
î‏ 


بينها وأثر بعضها على بعض. ويرى إليس (a A)‏ أن البحث الجيد هو ذلك 
الذي يعتمد على أكثر من نوع من هذه البيانات. 

ثانياً: التحليل التقابلي للغة المرحلية Contrastive Interlanguage)‏ 
(Analysis‏ 


التحليل التقابلي (Contrastive Analysis)‏ واحد من المناهج المستخدمة 
4 الأبحات اللغوية. وتكمن أهميته فيما يكشفه من أوجه التشابه والاختلاف 
بين اللغات المقارنة؛ و مجال مدونات المتعلمين يركز الباحثون على التحليل 
التقابلي للفة المرحلية من خلال نوعين من المقارنات: النوع الأول بين الناطقين 
باللغة بوصفها لغتهم الأم ومتعلميها من الناطقين بغيرهاء والنوع الثاني بين 
مجموعتين مختلفتين من متعلمي اللغة الناطقين بغيرهاء بحيث تتميزان 
عن بعضهما .2 آحد العناصر التي قد تؤثر 2 عملية التعلم T‏ ا 
مثل اللغة الآم للمتعلم» أو العمر. أو المرحلة الدراسية. أو مدة تعلمه للغة. أو 
عدد اللغات التي يتقنهاء أو غير ذلك من العوامل (قرانجر. ۰)2۱۹۹۸ انظر 
EAM‏ ۷. 


متعلمو اللغة الناطقون بها متعلمو اللغة الناطقون بغيرها 


متعلمو اللغة الناطقون بغيرها 
(المجموعة الأولى) 


الشكل (۷) الأنواع الرئيسة للتحليل التقابلي باستخدام مدونات المتعلمين 
يهدف النوع الأول إلى الكشف عن الفروق اللغوية بين الناطقين باللغة 
بوصفها لفتهم الأم مقارنة بمتعلميها الناطقين بغيرهاء ويكشف لنا هذا النوع 
لا د ا ddl‏ ا 


| aala هيد‎ 


اخداء من o 5$ A!‏ 
والايسمح بنشرضا ورقيا — 3 
أو تداو لها تجار یا WI‏ المدونات اللفوية العربية 
2 — بناو‌ها وطرائق الإفادة منها 


محدد بین کل قريق: ویمکن a‏ لذلك استخللاص ما سمح بالاستخدام (a E‏ 
أو الناقص. أو الخاطن لفردات وتراکیب اللغة بين متعلمیها الناطقین بفیرها؛ 
وهذا پساعد الختصین من باحثین ومعلمین ومصممي الناهج التعليمية 2 
توجیه الطلاب إلى الاستخدام الصحیح والأمثل للغة. وذلك بتقريبهم ما آمکن 
إلى آسالیب الاستخد ام الواقعية للناطقین بها. 

آما النوع الثاني من التحلیل التقابلي للفة الرحلية فیکون بين مجموعتین 
مختلفتین من متعلمي اللفة الناطقین بفیرها. حيث تکون القارنة على أساس 
آحد العناصر المؤثرة ب2 عملية التعلم. فالقارنة بين مجموعتین من الطلاب 
مع اختلاف اللفة الأم لكل منهما (كالقارنة Wia‏ بين مجموعة طلاب |نجلیز 
ومجموعة طلاب صینیین یتعلمون العربية) i‏ یساعدنا 2 معرفة آثر بعض اللفات 
على تعلم الطلاب للفة الهدف ایجاباً وسلبا. على سبیل المثال قد یکون تشابه 
آقسام الضمائر 2 بعض اللغات عاملا مساعدا للطالب على اتقانها. بینما 
یجد غیره صعوبة 3 فهم الحدود الدقيقة لاستخدامها. ومثل هذا النوع من 
القارنات بين مجموعات مختلفة من متعلمي اللفة الناطقین بغيرهاء یمکننا من 
الإجابة على عدة تساوّلات نحو: هل يؤثر aae‏ اللغات التي يتحدث بها الطالب 
على مدی قدرته على تعلم اللغة؟ ما مدی آثر العمر على فهم اللفة. واکتساب 
الفردات. 3355 القواعد. ونحو ذلك؟ هل يؤثر مستوی الطالب لغوياً على شیوع 
استخدامه لبعض الکلمات أو العبارات٩‏ 

ولا بد هنا من التنبیه على دور التصمیم الجید للمدونة؛ لیتمکن الباحثون 
من إجراء التحلیل التقابلي على آکبر عدد ممکن من العوامل. فجودة تصمیم 
الدونة تؤثر بشکل کبیر على جودة النتائج المستخرجة منها (سینکلیر. AVAAN‏ 
وقرانجر. ca AAA‏ والسليطي  Al-Sulaiti‏ 2۲۰۰۵). 

ثالثاً: تحلیل الأخطاء بمساعدة الحاسب Computer-aided Error)‏ 
(Analysis‏ 
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هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او تداو لیا تسار با 
ود 


بدأ العمل مجال تحليل الأخطاء اللغوية 2 نهاية ستينات القرن الماضي 
- أي قبل بداية وجود مدونات المتعلمين التي بدأت 2 أواخر ثمانينات القرن 
نفسه - وقد جمع كثير من العينات اللغوية للطلاب 2 ذلك الوقتء لكنها كانت 
تستخدم كمستودع للأخطاء فقط. لا على آنها مدونات للمتعلمین. وبالتالي 
یمکن التفریق بینها وبين مدونات التعلمین بآن هذه العینات لم تکن تجمع وفق 
معاپیر تصمیم واضحة. ولم يكن للحاسب الالي دور 2 تحلیل محتواها . اضافة 
إلى أنه كان يتم التخلص منها بمجرد استخراج الأخطاء ودراستها (نسلهاف. 
(evt‏ 
ومع استخدام أدوات تحليل المدونات على الحاسب الالي 2 الوقت الراهن. 
آصبح لدی الباحثین |مکانات كبيرة للوصول إلى تحلیل آعمق للاخطاء .2 
مدونات التعلمین. مع الحصول على نتائج آدق وبشکل آسرع. ویلعب وسم 
الأخطاء الدور الأكبر 4 هذا الجانب. فکلما كان تصنیف الأخطاء ووسمها 
يستند على معايير واضحة ودقيقة كانت نتائج البحث والتحليل أكثر جودة 
وبالتالي أكثر واقعية وفائدة. 
ومن الأمثلة على ذلك تلك الدراسة التي أجراها لي Lee‏ (۲۰۰۷م) 
2 جامعة اسكس Essex‏ حيث ald‏ ببناء مدونة تضم عشرين الف کلمة. 
عبارة عن نصوص كتبها طلاب كوريون يدرسون اللغة الانجليزية. أعمارهم 
iLd 335-3 5n‏ وبعد وسم جميع الأخطاء باستخدام أداة خاصة صممها 
هتشنسون Hutchinson‏ (۰)2۱۹۹۱ وهي أداة تعتمد على تصنيف الأخطاء 
اللفوية لدنيو وآخرين (e 431) .Dagneaux et al‏ أمكن استنتاج عدد 
الأخطاء ونسبتها تحت كل AT‏ من فئات الخطأ العامة والفرعية بسرعة 
ودقة عاليتين. فعلى سبيل المثال وجد الباحث أن أخطاء القواعد اللغوية 
كانت الأكثر بنسبة ۵, ۳۷ تلتها أخطاء علامات الترقيم بنسبة ۵, ANE‏ 
وفيما يخص التصنيفات الفرعية. وجد أن علامات التعريف والتنكير - 
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قند ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


تحت تصنيف القواعد - كانت الأكثر عرضة للخطأ بنسبة ۸, XE‏ وهذا 
النوع من الأبحاث 4 استنتاج الأخطاء وتحلیلها. يستخدم كأساس لكثير 
من الابحات التقدمة. والاغراض التربوية. فهو يساعد الباحثين على تتبع 
مستويات الطلاب ومدى تطور قدراتهم اللغوية. إضافة إلى تقصي أوجه 
القصور 2 الإستراتيجيات الحالية لتعليم اللفة. ومن ثم العمل على تلافيها 
مستقبلاً كما يساعد على تصميم کتب. ومواد تعليمية. ومعاجم طلابية 
أقدر على الوفاء باحتياجات المتعلمين وآهد افهم. وسيرد حديث أكثر عن 
بعض هذه الجوانب. 

رابعا: دراسة التطور اللغوي لدی ا لطلاب 

من الأبحاث القائمة على مدونات التعلمین ما یختص بدراسة مستویات 
الطلاب وقدراتهم اللغوية وقیاس التباین بين کل مستوی وآخر. مع دراسة 
العوامل المؤثرة 4 ذلك. ومن الأمثلة على ذلك تلك الدراسة التي قام بها 
باتيري وكاينز Buttery and Caines‏ (2۲۰۱۲) لبحث العلاقة بين مستوى 
الكفاية اللغوية مقارنة بطول الجمل التي يستخدمها الطلاب من ناحية, 
وبالتنوع والعدد 2 استخدام العبارات الظرفية من ناحية أخرىء وقد اعتمدوا 
2 ذلك على وسم وتحليل الأخطاء الذي سبق أن ذكرنا أهميته باعتباره أساسا 
لمثل هذه الدراسات. 

قد يكون هذا المجال هو الأساس الذي بدا منه ذلك النوع المعروف بمدونات 
المتعلمين التعاقبية (Diachronic)‏ أو الطولية (Longitudinal)‏ « والتي من آهم 
آغراضها قياس مدی تطور الطلاب لفویاً سواءٌ أكان ذلك بالاعتماد على نسبة 
الأخطاء 2 کل Abe ya‏ آم من خلال تتبع ما یحدث من تحسن 3 استخدام 
بعض الفردات. أو العبارات. أو الأدوات اللغوية. أو غیرها. بالتزامن مع تطور 
مستوی الكفاية اللغوية لدی الطلاب. 


۱۹۹ 


Wi‏ المدونات اللغوية العربية 


تا مد بناؤها وطرائق الإفادة منها 


dasLati aa 
إخداء من المركر‎ 
Là ja ولايسمح بنشرها‎ 
او تداوليا تجاريا‎ 
——- —h 


خامسا: تأليف معاجم الطلاب 


تعد صناعة المعاجم الموجهة لمتعلمي اللفة - الإنجليزية على وجه التحديد - 
من أوائل المواد التعليمية التي استفادت من الدراسات المعنية بتحليل مدونات 
التعلمین. آما 2 الوقت الحالي فأغلب معاجم الطلاب تعتمد على هذا النوع 
من المدونات, iride‏ المعاجم anlai‏ اللغة Monolingual learners’)‏ 
.(dictionaries‏ ومن الصور الشائعة لاستخدام مدونات المتعلمين ب4 بناء 
معاجم الطلاب. الاستفادة من مخرجات تحليل الأخطاء اللغوية على مستوى 
المفردات أو التراکیب. وتزويد قراء المعجم بتنبيهات حول هذه الأخطاء .2 
المداخل المعجمية المرتبطة بها. مع بیان صور استخدامها الصحیح. ويعد 
معجم Longman Essential Activator‏ ( سمرز (e ۷ «Summers‏ أول 
معجم یمتمد علی مدونة متعلمین؛ حیث cona d‏ «مدونة لونجمان» (شبكة 
مدونة لونجمان. ۲۰۱۲م) 2 تأليف هذا NT‏ (جیلارد وجاسبي Gillard‏ 
and Gadsby‏ ۱۹۹۸ م. وقرانجر. ۲۰۰۲م ب» ونسلهاف. ۲۰۰۶ج). 

ينوط لقا الشکل ۸ مثالا کا ساح من «سعجم لونجمان تلاختبارات» 
Longman Exams Dictionary‏ ( پولن .Bullon‏ ۲۰۰۱ م: 0٩‏ وقد تم 
وضعه على شكل ملحوظة 2 نهاية المدخل المعجمي لكلمة mind»‏ للتحذير من 
الأساليب الخاطئة لاستخدام هذه الكلمة والتنبيه على البدائل الصحيحة لها. 


STUDY NOTE Bielius 
موه‎ ind 


come/spring to mind Two possibilities came to mind. 


MES S 


الشكل )^( مثال eu AR‏ من «معجم لونجمان للاختبارات» 


danLati aa 
اهداء من المركز‎ 


ولايسمح بنشرغا lys‏ 


منت 0 
جح — بناؤها وطراثق الإفادة منها 


وقد توسع البحث 2 تأليف معاجم الطلاب البنية على مدونات التعلمین 
لونجمان للأخطاء الشائعة»(۳) Longman Dictionary of Common Errors‏ 


A انظر الشكل‎ ,)۵ :۱۹۹ Turton and Heaton وهيتن‎ (33593) 


access X Computers give us an easier access to information. 
/ Computers give us easier access to information. 
Access is an uncountable noun: "The entrance has been widened to 
provide easier access for disabled people.’ ‘They have no right to refuse 
us access to the files." 


الشكل )4( مثال لخطأ شائع من «معجم لونجمان للأخطاء الشائعة» 

والمعاجم التي تعنى بالتنبيه على الأخطاء الشائعة قد وجدت بكثرة 2 
اللغة العربية. ومنها «معجم الأخطاء الشائعة» (العدناني. ۰)2۱۹۸۲ و»العجم 
الوجیز 2 الأخطاء الشائعة والاجازات اللغوية» (محمد. (BEYT‏ ومعجم 
الا ن ا EEE‏ اموجه فارج كين سوت از 
وهي 2 الغالب موجهة للناطقين باللغة العربية. ولم تستفد من التطور الحاصل 
بين حقلي صناعة المعاجم ومدونات المتعلمين. 

2 مقابل المعاجم هناك بعض الدراسات التي اهتمت بدراسة شيوع 
الأخطاء لدى متعلمي اللغة. ومن ذلك دراسة العصيلي (۱۶۰۵ه) بعنوان 
«الأخطاء الشائعة 4# الكلام لدى طلاب اللغة العربية الناطقين بلغات آخری». 
وكذلك الشافعي وإبراهيم (۱۶۰۸ه) «الأخطاء الشائعة 2 الهجاء والاملاء 
بين تلامين المرحلة الابتدائية بمنطقة الریاض» والحمد (0١4١ه)‏ «تحليل 
أخطاء التعبير الكتابي لدى المستوى المتقدم من دارسي العربية غير الناطقين 
بها 2 جامعة اللك سعود» وغيرها من الأبحاث ذات المنهجية الواضحة 2 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


استخراج الأخطاء والحکم على شیوعها. لکنها استخدمت عینات بحثية خاصة 
s Lose Linus‏ ی مد کات uat‏ كما ان ع اه الطاوب که كن 
متفه من آي منها. 
سادسا: تدریس اللغة وتصمیم الواد التعليمية 

من الطرائق المستحدثة 2 تعليم اللغة. والتي أجريت دراسات كثيرة حول 
فاعليتها © اكتساب اللفة. تلك التي تستخدم فيها المدونات داخل الفصل 
الدراسي فيما يعرف بالتعليم الموجه بالبيانات «(Data-Driven Learning)‏ 
والذي يعرفه جونز 3255( (iii :ما55١( Johns and King‏ بأنه: 

استخدام البيانات اللغوية التي يتم توليدها داخل الفصل الدراسي. عن 
طريق استخدام كشاف السياقات (Concordancer)‏ على الحاسب الآلى: 
وذلك لمساعدة الطلاب على استكشاف العبارات والتراكيب اللفوية. وقياس 
مدى اطرادها 4 اللغة الستهدفة. ويشمل ذلك بناء أنشطة وتمارين لغوية 
ELS‏ على هآ ات اک رهم abhaase‏ 

وتمثل لذلك قرانجر وتریبل Granger and Tribble‏ )444 8( بتدریب صفي 
7 , 
تستخدم فيه المدونات النصية العامة جنبا إلى جنب مع مدونات التعلمین. 
حيث يطلب من الدارسين عمل قائمة بالكلمات التي ترد بعد لفظة محددة. 
ومقارنة أمثلة الناطقين باللغة )2 المدونة العامة) مع أمثلة الناطقين بغيرها 
)2 مدونة المتعلمين) . 

وسنورد Ua‏ تدریباً مشابهاً U‏ ذكر عند قرانجر وتريبل: لکنه مطبق علی 
اللفة العربيةء حيث استخدمنا المدونة اللغوية العربية لمدينة الملك عبدالعزيز 
للعلوم والتقنية( (é‏ ( الثبيتي Al-Thubaity‏ , 2۲۰۱۶) باعتبارها مدونة عامة, 
والمدونة اللغوية لمتعلمي اللغة العربية (الفيفي وآخرون. 2۲۰۱۶) باعتبارها 
مدونة متعلمين. 2 هذا التمرين يطلب من المتعلمين ما يلي: 
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Wi‏ المدونات اللغوية العربية 


تا ne‏ بناؤها وطراثق الإفادة منها 


۱- ایجاد الکلمات التي تتلو عبارة «باللسبة» 2 جمیع الامثلة العطاة. 

۲- فرز هذه الکلمات لایجاد الفردات التي وردت فقط 2 مدونة التعلمین 
ولم ترد 2 الدونة العامة. مع محاولة الحکم علیها بالسوّال عن مدی صحة 
استخدامها كما وردت 9 الأمثلة؛ وكيفية تصحیحها. ونحو ذلك. 


او توه اتان اة رة Gal iiyaa)‏ 
وأما العبد فقد يريد الشيء ويكون | بال 
وان كانت مدته أو عمره طويل لكنه | بال 

فذق ما تبسر dal‏ والترئیب يتفع اي اکن | بل 
و أصبحت الخاطب الفضل | بال 

فرص الاختيار بين السلع والخدمات سواء | Jb‏ 
وهوقلة كلام السلف وعظيم فقههم | Jb‏ 

ومن ثم اختيار القول الراجح 2 كل صورة . أما | IL‏ 
الذي هو بالنسبة إلى النحو كأصول الفقه | بال 
مما أضعف عزيمة آفراده. IL | Lal‏ 

وبالعادة يفضل هؤلاء السير على الأقدام . أما | Jb‏ 


له شرا فيخرج من هذه الجهة عن كونه 
إلى الزمن بعامة -الزمن المطلق- لا شك أنه 
لنا سنجري على وفق ما جرى هو عليه 

للجهات المانحة للمساعدات و المولة للبرامج 
للمنتجين أو المستهلكين كما إن المعرفة قد تلعب 
لمن بعدهم . فالصحابة رضي الله عنهم 
لتخريج الاحادیث فان كان الحديث 2 الصحيحين 
إلى الفقه 

إلى الجيش الإسلامي فقد كان قليل العدد من 
للحافلات السياحية فان التحسن السياحي 2 


ولهذا أرى النجاح إلى الآن -2 هذا التخصص | بالنسبة | لي بعيداء ولكن هد وارادتي وعزمي 
مشكلة مع العائلة التي كانت تأويني | بالنسبة | للطعام والأجرة وعدة مشاكل أخرى 
اهتماماتي الدراسية هي كثيرة وعديدة ولكن | بالنسبة | إلى التخصص الذي اخترته فهو التخصص العلمي 
وذلك أن الحاجة تدعو إليها | بالنسبة | Jal‏ بلديء معظمهم وأكثرهم محتاجون إلى الدعوة 
بعد دراسة اللغة العربية | بالنسبة | للمعهد سألتحق بكلية أصول الدين بإذن اللّه 
هذه هي قصة حياتي وأجمل قصة | بالنسبة | لي فقد قمت بوصفها لك واتمنى أن 
وبإذن سيتحقق حلمي الذي اریده. أما | بالنسبة | .3 اختياري له فليس له سبب 
فقد كانت من أكثر الواقف روحانيه | بالنسبة | الي فلازلت استشعر ذلك الموقف 
وايضاً ب كلية الشريعة استفادة كثيرة | بالنسبة | 3 كليات أخرى 
أو يرغب بهذا التخصص. | بالنسبة | أسرتي هم يقولون أي التخصص أريد 


الشكل (۱۰) مثال لتدريبات التعليم الموجه بالبيانات 
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بالإجابة على الأسئلة أعلاه. سيلاحظ الطالب أن الناطقين باللغة العربية 
4 جميع أمثلتهم استخدموا الحرفين «إلى» و»اللام» بعد عبارة «بالنسبة». 
بینما استخدم متعلمو اللغة إضافة إلى هذين الحرفین. حرف الجر مك 
والاسمين «أهل» و»أسرتي» مما يدفع الطالب للبحث حول صحة هذه التراكيب 
التي تفرد بها متعلمو اللغة دون الناطقين بها؛ ويظهر لنا من خلال هذا المثال 
القائم على المدونات النصية - ومنها مدونات المتعلمين - ما يمكن أن يكتسبه 
الطالب من استخدام لفوي صحیح لبعض العيارات: اعتمادا على بيانات واقعية 
غير مصطنعة. اضاقة لما يكتسبه الطالب عند تفريقه بين الناطقين بالعربية 
والناطقين بغيرها من الوقوف على بعض الأخطاء الحتملة. والمبنية على بيانات 
واقعية آیضا. ولا بد هنا من التنبيه على بعض المحاذير التي ذكرها الباحثون 
عند استخدام التعليم الموجه بالبيانات (انظر مثلاً تريبل و جونز Tribble and‏ 
Jones‏ ۱۹۹۷ م» وجونز ۱۹۹٤ Johns‏ م» وباكرد Packard‏ ۱۹۹۶م) e‏ ومن ذلك 
مثلا الحاجة إلى تدریب الطلاب على استخدام الدونات. وبرامجها. وطرائق 
البحث فيهاء مع الأخذ 2 الحسبان تفاوت الطلاب 2 القدرات الحاسوبية 
واللغوية. ومن المحاذير كذلك أهمية الاختيار الدقيق للأمثلة والسياقات التي 
تتوافق مع غرض التدریب» وكذلك تصميم التدريبات les‏ يناسب مستوى 
الطلاب. فإذا كان طلاب المستوى المتقدم قادرين على تمييز الخطأ 2 مدونات 
لني فان كيرهم رفن اتويات الأقل قم aseo uds‏ اب سا ادك 
يجد التوجيه الناسب. وبالتالي تكون المحصلة عكسية بأن يرسخ 2 ذهنه واحد 
أو أكثر من الأخطاء الواردة 2 مفردة أو تركيب لغوي. 

آما من ناحية تصميم المواد التعليمية. فقد قارنت بعض الدراسات (مثل 
لجنق Ljung‏ ۹۱م( بين تعليم اللغة باستخدام مواد تعليمية اعتمدت 2 
تصمیمها على المدونات العامة للناطقين باللفة. ومواد تعليمية أخرى مصممة 
بناء على اجتهاد وحدس الصمم أو المعلم نفسه. وأظهرت النتائج أن مخرجات 


٤ 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرضا Led pg‏ 
او تداولها تحار پا 


النوع الأول كانت آفضل بسيب اعتمادها على أمثلة لغوية حقيقية. وآن نقطة 
الضعف الکبری -2 النوع الثاني تتمثل 2 إغفال بعض النواحي المهمة لمشاكل 
الطلاب اللغوية. لكن قرانجر .Grangr‏ (2۱۹۹۸) ترى أن المدونات العامة 
وحدها لا تشير إلى درجة الصعوبة التي یواجهها متعلمو اللغة. سواء أكان ذلك 
2 الفردات آم ب التراکیب. وهنا تأتي آهمية مدونات التعلمین 2 تصمیم 
الواد التعليمية. فلا شك أن اعتماد مصممي الواد التعليمية اللغوية على 
كلا النوعین - الدونات العامة للناطقین باللفة اضافة إلى مدونات التعلمین 
الناطقین بغیرها - سيوّدي إلى تطور کبیر» مع امكانية توجیه هذه الواد لتلبي 
اجات الظلاب: اللقوية eta‏ آکبن ومن الناحية a adl‏ فقد بدا ai Lea‏ 
بعض الکتب التعليمية البنية على نتائج آبحاث آجریت على مدونات التعلمین. 
وهي نماذج إيجابية مشجعة (قرانجر. ۲۰۰۲م ب). 

Natural Language) الطبيعية‎ aa! البحث .2 معالجة‎ daila 
(Processing 

يستفيد مجال معالجة اللغة الطبيعية من مدونات المتعلمين ‏ بعض المجالات 
الهمة. منها على سبيل المثال التدقيق الاملائي. والتدقیق النحوي. المبنيان 
على نتائج تحليل الأخطاء. مما يعطي دقة أكبر 32 اكتشاف الأخطاء الاملائية 
والنحوية. وكذلك # اقتراح البدائل الصحيحة لها. وترتيبها بحسب أولويتها 
(انظر نورفيج 2101718, ۲۰۰۷م. و جارف سكي ومارتن -Jurafsky and Martin‏ 
٩‏ والکنهل وآخرون. ۲ ) من ذلك آیضا بناء تطبيقات لتعليم اللغة 
حاسوبياء وتستطیع هذه البرامج الافادة بشکل مباشر من مدونات التعلمین. 
لتولید تدریبات تساعد الطلاب على تجاوز الشاکل الفعلية التي تواجههم؛ 
مات aed‏ ی اختار تو اقوادة ca‏ یی الاك aL‏ 
وغیر ذلك من التطییقات الحاسوبية. انظر مثلا شانق وشانق Chang and‏ 
8 (4١٠5م)ء‏ والنسخة الالکترونية من دراسة موریرس U) Meurers‏ 


۱۳۵ 


Wi‏ المدونات اللفوية العربية 


تا مده بناؤها وطرائق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
بود 


تطبع بعد) بعنوان: مدونات المتعلمين ومعالجة اللغة الطبيعية Learner)‏ 


. (Corpora and Natural Language Processing 


وسم مدونات المتعلمين 

كما ذكرنا 2 بداية الفصلء فان وسم الأخطاء اللغوية هو أكثر أنواع الوسم 
شیوعا ‏ مدونات التعلمین؛ حیث تعتمد کثیر من اا عات مادتها على نتائج 
تحلیل هذه الاأخطاء. كأبحاث اکتساب وتعلیم اللفة. وکذلك تأليف العاجم. 
وتصمیم الکتب التعليمية. ومنها آیضا بعض تطبیقات اللفویات الحاسوبية. 
واستنادا على هذا الأساس سنذکر بعض الجوانب التعلقة بوسم الأخطاء 
اللغوية 2 مدونات التعلمین. 

T‏ ما هو وسم الأخطاء؟ 


وسم الأخطاء يعني وضع رمز خاص لكل نوع من آنواع الخطأ اللغوي ليسهل 
تمييزه عن الأنواع الأخرى عند البحث 2 المدونة وتحليل مادتها. ومن هذه 
oi‏ مكلذ Tos‏ فد اة Ly‏ بها سروف العلمة dae)‏ عرف 3l‏ 
إسقاطه أو استبداله بحرف آخر). ومنها كذلك الخطأ 2 الاعراب. والخطأ 
۶ علامات الترقيم (زيادة علامة ترقیم. أو اسقاطها. أو استبدالها بأخرى 
«(lias‏ وهکذا. وق الفالب یتم حصر الأخطاء الراد وسمهاء كم تصف بناء 
على مجالات أو cal n‏ عامة؛ لیسهل فهمها واستخدامها من قبل القائمين على 
عملية الوسم وكذلك التحلیل. 

خانیا: الدراسات التي عنیت بتصنیف الأخطاء 

منذ عقود مضت ظهرت کثیر من الدراسات الهتمة بتحلیل الأخطاء اللغوية 
التي یقع فیها الطلبة 2 کتاباتهم. ورغم أن هذه الدراسات قد صنفتٌ هذه 
الاخظاء ال كدف SERT) od‏ مكلا المي هه امن وال ١ه‏ 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداو لیا تسا با 


2 lpas ظل‎ lapi الا أن‎ o Ca 38 v oig ااه‎ a 
العینات البحثية التي تعالجها. متبعة ما یعرف بطريقة التصنیف «من آسفل‎ 
2 آي أن تکون البد اية بالبحث عن الأخطاء‎ «(Bottom-up approach) لأعلى»‎ 
عينة الدراسة وتحليلهاء ومن ثم یوضع تصنيف لهاء ولم يمتد اهتمامها لبناء‎ 
«(Top-down approach) لأسفل»‎ (lel تصنيف شامل بطريقة البحث «من‎ 
ار ترا ا خاي‎ usos من ا‎ M عيت رخ وهه اوخن‎ 
ومن ثم تتم عملية البحث عن هذه الأخطاء اللغوية وتحلیلها .2 النصوص‎ 
والمدونات وغيرها. هذه التقسيمات الشاملة للأخطاء لا تقتصر فائدتها على‎ 
2 وسم مدونات التعلمین» بل تتعدى ذلك إلى فوائد أخرى. مثل استخدامها‎ 
تعليم اللغة وتصحيح النصوص للطلاب من قیل معلمیهم. حيث تمنح العلم‎ 
والطالبٌ وضوحا 4 تحدید نوع الخطأ بدقة سول معها التعرف على أسبابه‎ 
وطرائق علا جه.‎ 

من المحاولات القائمة لبناء تصنيف لأنواع الأخطاء 2 اللغة العربيةء ما 
قام به غازي آبو حكيمة وآخرون (a A)‏ من ترجمة لاحد تقسيمات الأخطاء 
بق ois aU‏ قرا فك dada Mes E‏ على ا Had‏ 
ويشتمل هذا التصنيف على ثلاث طبقات. الأولى مجالات الخطأ وهي: 
الشکل. والصرف. والقواعد. والفردات. والنحو وازدواجية اللغة؛ والاأسلوب. 
وعلامات الترقیم. والأخطاء الطبعیة؛ آما الطبقة الثانية فحوت فثات ال خطاء 
الفرعية المندرجة تحت المجالات التسعة السابقةء والطبقة الثالثة جاءت تحت 
اسم الفئات القواعدية وفيها أربعة أقسام: الاسم» والفعل. وعلامات الترقيم, 
والرابع لم يسمّه ولعله الحرف. وهذه الطبقة الثالثة عنيت بالبنية الصرفية 
أكثر من عنايتها بالأخطاء. انظر آبو حكيمة وآخرين i (aY A)‏ وكذلك الفيفي 
وأتويل (۲۰۱۲م) لزید من الإيضاح حول هذا التصنيف. 


۱۳۷ 


Wi‏ المدونات اللغوية العربية 


تا ne‏ بناؤها وطراثق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


التصنیف الاخر قام به الباحث کجزء من مشروع الدونة اللفوية لتعلمي 
اللغة العربية ( الفيفي وآخرون. (e Y Y‏ وفیه طبقتان. الأولى تشمل مجالات 
aid‏ يفيت كنا لتسلسل الستویات اللفوية كما يلي: خطأ املاتي. خطأ 
صرك. خطأ نحوي. خطأ دلالي» وبعدها يأتي الخطأ 4 علامات الترقيم. تحت 
كل مجال من هذه المجالات الخمسة مجموعة من الفئات الفرعية اعتمد فيها 
الباحث على عدة دراسات اهتمت بتصنيف الأخطاء وطرق وسمهاء وبهذا جمع 
بين طريقتي البحث السالف ذكرهماء الأولى المسماة «من أسفل لأعلى». حيث 
ف ااا اا لاه عن تام موه من الدواعنات 
العلمية التي درست عينات كبيرة من أخطاء متعلمي اللغة (انظر الفيفي 
Y Y «dista‏ *5م)ء ومن ثم انتقل إلى الطريقة الثانية المسماة «من أعلى لأسفل» 
من خلال اختبار التصنيف وتطبيقه على عينات من مدونات التعلمین. ومنها 
الدونة اللغوية لمتعلمي اللفة العربية. كما قام الباحث بتقويم هذا التصنيف 
عدة مرات مستقلة لتحسينه وتنقیحه. و كل مرة يطبق على عينة مختلفة 
من النصوص؛ للتأكد من دقته وشموله ووضوح تصنيف الأخطاء فيه. كما قام 
الباحث بدراسة حول استخدام هذا التصنيف بالقارظ بع تصني أبو حكيمة» 
وذلك بوسم عينة من النصوص بواسطة باحثيّن مستقلیّن. وتم وسم هذه العينة 
مرتين باستخدام أحد التصنيفين ‏ كل مرة. مع قياس مدى التطابق بين 
الباحثين عند استخدام كل واحد من تصنيفات الأخطاء؛ وقد أظهرت النتائج 
أن التطابق بين المشاركين عند استخدام التصنيف المقترح كان أكثر منه عند 
استخدام تصنيف أبو حكيمةء وللاطلاع على نتائج هذه الدراسة انظر الفيفي 
وآخرين (۲۰۱۲م). 
خالثا: الأخطاء التي توسم 
یعتمد ذلك على الغرض من دراسة الأخطاءء فعلی الرغم من استخدام 
آغلب الباحتین للتصنیفات الوجودة بسبب شمولها لاهم الأخطاء اللفوية. الا 
أن هناك من یدرس نقاطا محددة يعمد فیها إلى استخدام تصنیفه الخاص 


۱۳۸ 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداو لیا تسا با 


الذى يعدن آهداف بحثه بشکل مباشر, ومن ذلك مكلا أن يكتفي, بوسم 
الأخطاء التي يجري علیها دراسته مع اضافة بعض التفاصیل علیها. فمن 
يدرس آخطاء الهمزة على سبیل (JUI‏ قد یتعمق آکثر .2 تصنیفها لتشمل کل 
الأخطاء cbe‏ كان تمهاد إلى العظاء اليد فيط et i‏ اغا 
2 الهمزة التوسطة. والخطاً 2 الهمزة المتطرفةء وکل واحد منها له أقسامه 
الفرعية. ففي آول الكلمة قد یتعلق الخطاً بکتابة همزة الوصل أو اسقاط 
همزة القطع, وی وسطها قد تسم الأخطاء بناء علی انحرف الذي تکتب 
عليه الهمزة. وهکذا. آما مدونات التعلمین - موضوع حدیشا 2 هذا البحث 
د ر ا ads‏ علي ات Tesi]‏ افا کت القن Esta daBs‏ 
(أبو حكيمة وآخرون, ۲۰۰۸م. والفيفي وآخرون. ۲۰۱۳م)؛ وسبب ذلك 3523 
إلى عموم الهدف من إنشاء مثل هذه الدونات. فناسب أن يكون وسم الأخطاء 
فيها عاما كذلك. 

رابعاء كيفية وسم الأخطاء 

يستخدم الباحثون عدة طرق لوسم الأخطاء تعتمد على نوع الملفات 
المستخدمة لحفظ النصوص txt)‏ أو xml‏ مثلا). وكذلك برامج تحليل هذه 
النصوص. إضافة إلى جدول تصنيف الأخطاء نفسه الذي ا جا ی 
القيود على طريقة وضع الوسوم. من هذه الطرائق أن تدرج وسم الخطأ بعد 
الكلمة أو العبارة الخاطئة مباشرة. على أن يكون الوسم محصورا بعلامتين 
تميزهما عن النصء وهي .2 الغالب الأقواس المثلثة <>. كما يضيف بعض 
الباحثين إلى وسم الخطأ الشكل الصحيح للكلمة أو العبارة الخاطئة (انظر 
الشكل .)١١‏ ويمكن لبعض البرامج المستخدمة 2 تحليل المدونات - مثل ورد 
سميث تولز )0( WordSmith Tools‏ (سکوت «Scott‏ 17١5م)-‏ إدراك أن ما 
بين هذه الأقواس وسوم إضافية على النص وليست من أصله؛ فلا يتم عرضها 
مع النص الأصليء مع تمكين المستخدم من البحث 2 هذه النصوص وتحليلها 
بناء على تلك الوسوم. 


۱۳۹ 


Wi‏ المدونات اللغوية العربية 


تا ne‏ بناؤها وطراثق الإفادة منها 


هذه الطيعة 
إخداء من المركر 
ولايسمح بنشرغا ور قیا 
او تداو لها تسار با 
|« —— 


«وما كنتو< 06 كنت > وحيد » OM‏ وحيدًا > في هاذا < 0 هذا > الأمر < PM‏ 


الأمر. > بل كانت < 6× كان> معي زملاءي » OH‏ زملائي > الآخرين XC»‏ 


الأخرون «« 


الشكل (۱۱) مثال لوسم الأخطاء وتصويبها ضمن النص 
من طرق وسم الأخطاء كذلك فصل الكلمات بحيث تكون كل كلمة - أو 
وحدة صرفية أو معجمية - 2 سطر مستقل. على أن یجعل وسم الخطأ مقابلاً 
للكلمة الخاطتة. وتفصل بينهما مسافة algas.‏ (80)): كذلك يكون التصويب 
بعد الوسم مع وجود نفس الفاصل (انظر الشكل e (1Y‏ وتستطيع أداة البحث 
والتحليل سكتش انجن(۱) Sketch Engine‏ ( کیلقارف Kilgarriff‏ ۰۰م( 
قراءة هذا النوع من التنسيق. 


الشكل JE (Y)‏ لوسم الأخطاء وتصويبها على شكل أعمدة 


aa‏ االحطيفة 
اهداء من المركز 


ولايسمح بنشرغا ور قیا 
ai‏ تداو لیا تسار با W‏ المدونات اللغوية العربية 


جح ود بناؤها وطراثق الإفادة منها 


وفيما يلي (الشکل۱۲) نموذج تم تولیده آلیا بتفسیق XML‏ من نصوص 
الدونة اللغوية لتعلمي اللغة العربية. وذلك بعد وسم وتصحیح الأخطاء فیه. 


xml version-"1.0"B$ 
«doc ID-"S037 T2 M Pre NNAS W C"» 
«text» 

«title» 
«t <۲/>تخصصي<1021‎ 
<t id-2»,4/t» 
«t <</>المستقيل<10>3‎ 

</title> 

<p id=1> 
<t <</>لما<10>6‎ 
<t />نتظر<10>7‎ << 
«t <+/>إلى<10-8‎ 
«t <<+/>العالم<10-9‎ 
«t 10-10 ErrTag-"XG" ErrForm-" الإسلامية‎ " CorrForm-" </>الإسلامية<" الإسلامي‎ 
«t اليوم<10-11‎ ,>/۲< 
«t id-12»s j3«/t» 
<t id-13»! <۲/>کتیر‎ 
<t id-14»jga«/t» 
<t المشكلات<10>15‎ >/<< 
«t id-16»g3,«/t» 
<t انمسلمون<10217‎ >/< 
«t 10218< </>,قیه‎ 
<t <۲/>وتتسا ء ل<10219‎ 
«t <ع/>ما<10>20‎ 
«t 10-21 ErrTag-"PC" ErrForm-"jaJ!," 2۵22۲0 الحل<" الحل؟‎ ,</t> 
<t 1022<۱ />وماة‎ t< 
«t </>نقعل<10223‎ 
«t />حتی<10224‎ << 
«t id-25»pa <۲/>نسا‎ 
«t id-26»,3/t» 
«t i4=27<حالصإ>/‎ t< 
«t id=28 ErrTag-"PC" ErrForm=" أمتنا‎ ." CorrForm="؟‎ Lii آمتتا<"‎ .</t> 
«t <ع/>متذ<29>-10‎ 
«t id=30>ji</t> 
«t id-31»ol <ع+/>يد‎ 
<t id-32 ErrTag-"OM" ErrForm=" p! jail L9" CorrForm-" ام‎ JJ ام< "با‎ j2 Cac / t» 
«t <+/>يالدين<10>33‎ 
«t id-34»à$ A3,«/t» 
«t الجاهلية<10>35‎ ,«/t» 
«t id=36>aÎ <ع/>يد‎ 
«t <<:/>بالتعرف<10>37‎ 
«t <۲۰/>علی<1038‎ 
«t id-39»J! />أحو‎ t< 
<t انسلمین<10240‎ >/< 
«t الیوم<10241‎ >/۲< 
«t id-42»,3,«/t» 
<t id-43 ErrTag-"SW" ErrForm=" التاريخ‎ ,۲ CorrForm-" <ح/>, التاريخ<", الماضي‎ 
«t />فعرقت<44>-10‎ << 
«t id=45>löi</t> 
«t id-46»4X/t» 


«t id-47» 3i $«/t» 
L: 5 حدق قحك‎ ir E 


الشكل (۱۳) ملف بتنسيق XML‏ من المدونة اللغوية لمتعلمي اللفة العربية بعد وسم 
الأخطاء وتصويبها 


۱۳۱ 


هذه الطيعة 
إخداء من الرکز 
ولايسمع بنشرها Led pg‏ 
او تداولها تسار با 
بود 


وقبل أن نختم حديثنا هناء نود التنبيه على أن مدونات المتعلمين لم تقتصر 
على وسم cellas YI‏ وانما فصلنا الحديث حوله لأهميته الخاصة 2 هذا النوع 
من الدونات. مع التأكيد على أن مدونات المتعلمين قابلة - كفيرها من المدونات 
- لوسم الكلمات من الناحية الصرفية. والنحوية, والدلاليةء والبلاغية. وغير 
ذلك من أشكال الوسم التي لا يمكن استقصاؤها هناء وعلى قدر غنى المدونات 
من ناحية الوسوم تزداد الفائدة من مادتها. ولنضرب لذلك أمثلة؛ فعندما 
تکون الاخطاء موسومة. إضافة إلى وسم الكلمات صرفیا؛ یمکننا البحث عن 
الأخطاء 4 بنية صرفية معينة. مثل آخطاء الهمزة 2 الأفعال الضارعة. 
وو اشفا تولف SEE aset susti‏ عن اعنام $351 
الاعراب. أو الجنس, أو العدد. أو التعریف والتثکیر» ما بين الأسماء والصفات. 
وهكذا. 


الخاتمة 

استعرضنا + هذا المبحث مدونات المتعلمين من عدة جوانب. ووقفنا على 
مجالات استخدامهاء ورأينا ما تزخر به من |مکانات. وما يمكن أن تسهم به 
2 سبیل الرقي بالبحث اللغوي لآفاق أرحب, بداية من اكتساب وتعليم اللغة, 
وتأليف العاجم. وتصميم alli‏ التليمية وضیلا لاستخدانها .3 مجان 
اللغويات الحاسوبية: وتعليم اللغة بمساعدة الحاسب. ومع تعدد هذه الأبحاث 
والموضوعات فلا زال المجال dul‏ والطريق ممتدة للاستفادة من مدونات 
المتعلمين 2 مجالات جديدة وباستخدام طرائق شتی. 

كما أتينا على آهم أنواع الوسم 3 مدونات التعلمین. وهو وسم الأخطاءء 
وأكدنا على أن هذه المدونات يمكنها الاستفادة من أنواع الوسوم الأخرى مما 
يوسع إمكاناتها ويضاعف طرق البحث فيها. وبما أننا قد أتينا على مجموعة 
من مدونات المتعلمين العربية 4 إشارة إلى بداية الاهتمام بها. فان مما 
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قند ۱ سار وق 
اخداء من المركر 
والايسمح بنشرغا ورقيا 
او تداوليا تجاريا 


ينبغي التنبيه عليه 2 هذا alati‏ أن العمل 2 مجال مدونات المتعلمين العربية 
ووسمهاء والاستفادة منها ب4 مجالات البحث اللغوي - أو غيرها من المجالات - 
لا یزال 2 آوله. ويحتاج للكثير من الدراسات ليصل إلى مستويات أفضلء ولعل 
هذا الفصل قد مهد الطريق لذلك. وكوّن نقطة انطلاق لكثير من الباحثين 
بإذن اللّه تعالى. 


شکر وعرفان 
للزملاء الکرام الذین تفضلوا بمراجعة هذا البحث. وآبدوا ملاحظات قيمة 


ساعدت على تنقيحه وتهذیبه. 


الحواشی 

(Y)‏ من الصطلحات الستخدمة للدلالة على عملية الوسم «التحشية» أو 
«الترمیز». و2 هذا الفصل اعتمدت مصطلح الوسم. انظر «قائمة مصطلحات 
لسانيات | لمدونات اللغویة» للد کتور محمود اسماعیل صالح: 

صالح. محمود إسماعيل: قائمة مصطلحات لسانيات المدونات اللغوية 
corpus-/01/2014/http://dr-mahmoud-ismail-saleh.blogspot.co.uk‏ 
linguistics.htmlZmore‏ 

(Y)‏ یمکن تسمیتها كذلك «تراکمیة». آو «تتبعیة». لكني فضلت مصطلح 
مدونة طولية ليكون مقابلا متاسبا للمدونة العرضية. 

(Y)‏ توجد نسخة معربة من هذا القاموس بعنوان «معجم لونجمان للا خطاء 
الشائعة بج اللغة الإنجليزية (إنجليزي - إنجليزي - عربي)». نقله إلى العربية 
یلوا( ی 
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DE‏ — بناؤها وطرائق الإفادة منها 


هذه الطيعة 
اخداء من المركر 
و لایسمع بنشرها Leä ja‏ 
او نداو لها تحار پا 
mı‏ 


راغب. نبيل: معجم لونجمان للأخطاء الشائعة 2 اللغة الإنجليزيةء الشركة 
المصرية العالية للنشر - لونجمان: الجيزة - مصر. ۲۰۰۷م. 
)٤(‏ يمكن الوصول إليها عن طريق الرابط التالي: http://www.kacstac.org.sa‏ 
)0( يمكن تنزيله من الرابط التالي: /http://www.lexically.net/wordsmith‏ 


)1( یمکن الوصول الیها عن طریق الرابط التالی: http://www.sketchengine.co.uk‏ 


مصادر اضافية حول مدونات المتعلمین 
المتعلمين؛ ولعل البحث الذي نشر للباحث (الفيفي. (aY NY‏ 2 مؤتمر هندسة 
وعلوم الحاسب باللغة العربية. من آوائل الراجع العربية التي تناولت هذا النوع 
وسأشير هنا إلى آهم الصادر باللغة الانجليزية: 

مدونات المتعلمين الحاسوبية واكتساب اللغة الثانية وتعليم اللغة الأجنبية 


Computer Learner Corpora, Second Language Acquisition and 
Foreign Language Teaching 


o‏ دور مدونات المتعلمين الحاسوبية 2 اكتساب اللغة الثانية وتعليم اللغة 


المناهج القائمة على المدونات 2 بحث اللغة المرحلية 
وسائل تدريس اللغة الأجنبية المبنية على المدونات 
الكتاب من إصدار دار النشر الألمانية 

John Benjamins Publishing Company 


2م 
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هذه الطبعة | 


إخداء من الرکز É—‏ 
و لایسمح بنشرغا ور Led‏ 1 : 
— بناؤها وطراثق الإفادة منها 


عشرون Lole‏ من البحث 2 مدونات المتعلمين: نظرة على الماضي للمضي قدما 
Twenty Years of Learner Corpus Research: looking back,‏ 
moving ahead‏ 


يضم هذا الكتاب أكثر من أربعين بحثا تمثل السجل العلمي 

لأول مؤتمر يقام حول مدونات المتعلمين -2 سبتمبر ۲۰۱۱ 

2 جامعة لوفاين ببلجيكاء وقد طبعت الأبحاث المقدمة 

للمؤتمر ك هذا الكتاب متسلسلة دون تصتيف» لکنها 

شملت عدة موضوعات مثل تصميم مدونات التعلمین. 

وجمع بیاناتهاء ووسمهاء وکذلك تحلیلها صوتیاء ونحویاء ودلالیاء وبلاغیاء 
وغیرها من الجوانب التي تعکس الاهتمام بهذا النوع من الدونات. 


التحلیل والعالجة الآلية للبیانات .2 مدونات التعلمین 
Automatic Treatment and Analysis of Learner Corpus Data‏ 
يتناول هذا الكتاب مجموعة من جوانب البحث المتعلقة بمدونات التعلمین. 
وقد ضم - بعد مقدمة حول مستقبل هذا النوع من المدونات - مجموعة من 
الأبحاث توزعت على ثلاثة فصول: 


Jat‏ جمع مدونات التعلمین. ووسمهاء وتبادل موادها 


الثاني: وسائل آلية للتعرف على خصائص لفة المتعلمين 


الثالث: تحليل البيانات 4 مدونات المتعلمين 
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اخداء من المركر 
و یسم بنشوغا ور Lä‏ 
او تداو لیا تسار با 
mî‏ 


رؤى لغوية تطويرية حول أبحاث مدونات المتعلمين 
Developmental and Crosslinguistic Perspectives in Learner‏ 
Corpus Research‏ 


يشتمل هذا الكتاب على فصلين: يركز الفصل الأول 
على مشروع المدونة duail‏ الدولية للغة المرحلية 


The International Corpus of Crosslinguistic ) 


(Interlanguage‏ وما أجرى عليها من أبحات» تينما 


يضم الفصل الثاني مجموعة متنوعة من مدونات 
التعلمین. ذات البیانات المنطوقة Spoken learner)‏ 
«(corpora‏ وما تم علیها من آبحاث تتعلق بیناثها: 
ووسمها. وتحلیلها. 


الجلة الدولية لأبحاث مدونات التعلمین 


International Journal of Learner Corpus Research 


وهي دورية حديثة يبدا صدور العدد الأول منها مطلع 
عام 06م من دار النشر الألمانية John Benjamins‏ 
.Publishing Company‏ تهتم هذه المجلة بنشر 
الأبحاث التي تتناول بناء مدونات المتعلمين؛ ووسمهاء 
وتحلیلها. واستخدامها 2 أي مجال من مجالات 
البحث اللفوي. ورابطها على الشبكة العنكبوتية: 


https://benjamins.com/Zcatalog/journals/1jlcr/main 
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حسان. حسلينا و غالب. محمد فهام محمد: مشروع جمع المدونات 
النصية الخاصة بالنصوص الأكاديمية 2 اللغة العربية. مجلة مجمع اللغة 
العربية الأردني العدد الخامس والتمانون. 17١٠م,‏ ۰۷۱-۵۷ 
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الملك سعود ‏ الریاض: ۸ ده 

الشافعي» إبراهيم محمد و ابراهیم. عبدالحميد صفوت: الأخطاء 


مركز بحوث كلية التربية 2 جامعة الملك سعود. ۱۶۰۸ه. 


العتيق» زايد مهلهل: تحليل الأخطاء الدلالية لدى دارسى اللغة العربية من 
غير الناطقين بها 2 مادة التعبير الکتابی» رسالة علمية غير منشورة. جامعة 
الامام محمد بن سعود الاسلامية. الریاض: aE NY‏ 

العدناني» محمد: معجم الأخطاء الشائعة. مكتية لینان. بیروت. الطيعة 
الثانية. AY‏ 


۱۳۷ 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه االظبعة 
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Aata aia 
اخداء من الرکز‎ 
ولايسمح بنشرغا ورقياً‎ 

al‏ تاو لیا تجارپا 


المبحث الثالث 


تصمیم المدونات اللغوية وبناؤها 


عبدا لحسن بن عبيد الثبيتي 
مدينة الملك عبد العزیز للعلوم والتقنية 


الریاض. المملكة العربية السعودية 
aalthubaity 2‏ 


Rasta lacus 
إخداء من الرکز‎ 
Led ولايسمح بنشرها ور‎ 

a‏ تداولها تسار با 
ود 


تخا 

بغض النظر عن التعريفات المتعددة للمدونات اللغوية (المدونة فيما بعد) 
باختلاف توجهات الباحثين 2 هذا الجال. فإنها بيانات يحاول الباحثون 
بواسطتها دراسة اللغة من خلال استخدامها الفعلي كما فعل علماء اللغة من 
قبل. وما زالوا + دراستهم للغة ووضعهم لقواعدها ولكن بمنهج جديد يعتمد 
على شواهد كثيرة أصبحت متاحة هذا العصر بسبب تطور الحاسب وتوافر 
النصوص الإلكترونية بشكل كبير. ولآنه من المستحيل عمليا جمع كل ما قيل 
وکتب للحصول علی آحکام دقيقة وفاصلة؛ فاننا آمام عبار الخرييدو آکثر واقعية 
ویستند إلى آساس علمي ألا وهو جمع عينة متوازنة وممثلة للغة أو إحدى صورها 
أو ظواهرها محل الدراسة. ومثلما هو حاصل 2 مجالات علمية مختلفة. مثل: 
الطب أو علم النفس؛ فان النتائج التحصل علیها اعتمادا على دراسة العینات 
وتحلیلها يمكن الوئوق بها متی ما توفرت ثلاثة شروط رئيسةء هي: (Y‏ ألا تکون 
العينة منحازة وآن تکون كافية للدراسة. (Y‏ أن تدرس هذه العينة وتحلل باتباع 
منهج علمي. (Y‏ الحصول على نفس النتائج متی ما استخدم النهج نفسه على 
ذ ات العينة. يقدم هذا الفصل اطارا عملیا للإجراءات التي تمکن الباحث من 
تحقیق الشرط الأول من خلال اتباع معاییر واضحة لتصمیم وجمع نصوص 
الدونة لتکون عينة متوازنة وممثلة لمجال الدراسة اللغوية مع تعریف مبسط 
لبعض الأدوات التي تساعد 2 دراسة الدونات بشکل میسر متی ما توفر النهج 
العلمي لدی الباحث (الشرط الثاني). ویمکننا تحقیق الشرط الثالث عندما 
تکون جمیع العلومات الخاصة بتصمیم وبناء الدونة موثقة ومتاحة للباحنین 
الآخرين مع إتاحة نصوص الدونة مجاناً أو بمقابل مادي- يما لا بخرق قوانین 
وأنظمة الحقوق الفكرية أو الخصوصية الشخصية - لیتمکن الباحثون من 
التحقق من نتائج الدراسات الأخرى التي آجریت على الدونة. 
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والايسمح بنشوغا ورقيا 
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معدمهة 

قبل أن يفكر الباحث 2 تصميم وبناء مدونته اللغوية الخاصة. عليه أن 
يجيب عن السؤالين التاليين: 

.١‏ ما الغرض الذي من أجله أريد أن استخدم المدونة؟ 

عادة ما يتم تحديد الفرض من استخدام المدونة بوضع سوال أو عدة أسئلة 
تكن مدان البضثف ذا CENSURE Elm EE‏ 
التي بریدها وكيفية الحصول علیها. وتتطلب الاجابة عن السؤال الثاني ممرفة 
بتصمیم ومحتویات الدونات التوفرة وأدوات البحث فيها واطلاعا على الأبحاث 
التي تمت باستخدام هذه المدونات؛ ليطلع الباحث على جوانب القوة والقصور 
فيهاء وليعرف مدى قدرتها على الإجابة عن أسئلة بحثه. وإن لم يجد الباحث 
مدونة تفى بالاجابة عن أسئلته فقد يضطر إلى أن يعدّل أسئلته أو محددات 
بحثه ليتمكن من استخدام المدونات التوفرة. أو أن يغيرها تماما لتتناسب مع 
ما هو متوفرء أو قد يلجأ - إن كان لديه الوقت والإمكانات - إلى بناء مدونته 
الخاصة. 


وعلى الرغم من توافر عدد لا باس به من المدونات العربية (انظر المبحث 
الأول من هذا الكتاب) إلا أن أغلبها Y‏ يوضح المعايير التي اتبعت 2 dgn‏ 
وجمع نصوصها. وما هو الفرق بين التصميم والحتوی الفعلي للمدونة 
بشکل راضم ولملي آل من هذا فون من الدونات العربية وهي مدونة 
اللغة العربية العاصرة Corpus of Contemporary Arabic‏ من جامعة Jad‏ 
( السليطي وآتول ۰۲۰۰۲ (Al-Sulaiti and Atwell‏ والمدونة العالية للغة العربية 
International Corpus of Arabic‏ من مكتبة الإسكندرية (الأنصاري وآخرون 
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Wi‏ المدونات اللغوية العربية 
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هذه الطيعة 
اخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او تداو لیا تسار با 
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Alansari et al ۷‏ .( ؛ والمدونة اللغوية العربية لمدينة الملك عبد العزيز للعلوم 
والتقنية (الثبيتي .(Al-Thubaity-Y*V&‏ وأفرّق هنا بين أن توضع معايير 
تستخدم مرشدًا لجمع نصوص المدونة واستخدامها لجمع النصوص وبين أن 
يتم توضيح محتويات المدونة وتوزيعها بعد جمع نصوصها دون الاسترشاد بأية 
معايير تضبط هذا الجمع. 

يتطرق القسم الثاني من هذا المبحث بشكل مبسط ومختصر إلى أهم 
المعايير التي من المفترض وضعها وتوثيقها عند تصميم المدونات لتكون متوازنة 
وممثلة للغة محل الدراسة. ويتعرض القسم الثالث إلى خطوات بناء المدونات 
بحيث تحقق معايير التصميم. أما القسم الرابع فيتعرض لأهم الآدوات اللازمة 
اما مه y aad f‏ الشیم oui sa dI‏ انا شي ف با 36$ ۶ a‏ 
الثاني والثالث. و القسم السادس مثال تطبيقي على خطوات التصميم 
والبناء المذكورة 2 القسمين الثالث والرابع. آما خاتمة المبحث وخلاصته فهي 
4 القسم السابع. 


يتطرق هذا القسم إلى أهم المعايير التي يجب وضعها ‏ الاعتبار وتحديدها 
بوضوح قبل البدء بجمع نصوص المدونة. تساعد هذه المعايير -إن طبقت 
بشكل دقيق عند جمع النصوص- على أن تكون المدونة قادرة على إجابة أسئلة 
البحث أو الفرض الذى بئیت من اجله. تعد هذه العاپیر اطاوا عاما بحدد 
نوعية وكمية الجهد الذي يجب أن یبذل 2 الخطوات التي تلي التصمیم. إن 
وضع هذه العاییر والاهتمام بها منذ البد اية ينقل الدونات من کونها بیانات 
يهتم بها بعد انجازها «مجموعة من البیانات اللفوية المكتوبة أو النطوقة» كما 
عرفها کریستال (کریستال ۱۹۹۲ (Crystal‏ إلى کونها عملاً منهجياً مخططا 
اروا له آهد اف واضحة منذ البداية «مجموعة من نصوص اللفة 4 صورة 


شنه ۱ انار وق 
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إلكترونية تجمع اعتمادا على معاییر خارجیة؛ لتمثل قدر الستطاع اللفة أو حد 
صورها لتكون مَصيدرًا للأبحاث اللغوية» (سنکلیر 0 (Sinclair‏ . 


والمقصود بالمعايير الخارجية هناء المعايير التي تعتمد على الوظيفة 
التواصلية للنص ب الجتمع الذي ظهر فیه. وهذه المعايير تشبه إلى حد كبير 
العلومات الببليوغرافية للنص مثل الوعاء الذي صدر فيه النص وموضوعاته 
المختلفة والمنطقة الجغرافية التي صدر منها. وقد تشمل معلومات أخرى مثل 
جنس الكاتب وجنسيته ومستواه الاجتماعي. أما المعايير الداخلية للنص فإنها 
تتعلق بالبنية اللفوية الداخلية للنص ذاته مثل كونه يحتوي على تركيب نحوي 
أو صر بصيفة معينة. إن الاعتماد على المعايير الداخلية يعزز بشكل كبير 
ظهور هذه التراكيب وما يلازمها عادة وبالتالي لا يعكس صورة محايدة عن 
استخدامها الفعلي مقارنة بغيرها من الظواهر اللغوية. 

إن آول ما يتحكم 2 معايير بناء المدونات التي سوف نتطرق إليها 2 الأقسام 
الفرعية التالية هو الغرض الذي تبنى من آجله. هذا الفرض يجب أن يكون 
واضعاً وجحذذا Xs‏ منذ البد اية. ویمکننا بشکل عام آن نقسم الأغراض التي 
تبنی لاجلها الدونات إلى قسمین رئیسین: آغراض خاصة/محددة وأغراض 
عامة/شاملة. 

یتمیز القسم الأول بمحاولته الاجابة عن أسئلة محددة. وبالتالي فان نتائج 
الدراسة لا یمکن تعمیمها على اللفة ککل. مثل: أن یکون الفرض من بناء الدونة 
دراسة التراکیب النحوية .2 لغة الشعر الجاهلي أو دراسة الأفعال 2 آبحاث 
علوم الكيمياء أو دراسة آخطاء متعلمي اللغة العربية لفة ثانية. ویمکن أن يلحق 
بهذا القسم الدونات التي تبنی لأغراض معالجة اللغة أو نمذجتها فقط ولم 
یوضع 2 الحسبان عند تصمیمها الدراسات اللفوية. ومن أمثلة هذه الدونات 
مدونة متعلمي العربية من جامعة لیدز ( الفيفي وآخرون ۰۲۰۱۶ (-Alfaifi et al‏ 
(انظر البحث الثاني من هذا الکتاب) . ومدونة مدينة اللك عبد العزیز للعلوم 


Yo! 
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هذه االظبعة 
اضدا: من المركر 
و aas‏ بنشرها ور Led‏ 
او تداو لیا تجاریا 
ود 


والتقنية لتصنيف النصوص (خورشید والثبیتی ۰۲۰۱۳ Khorsheed and Al-‏ 


۰۲۰۱۲ ومدونة تصحیح الأخطاء الاملائية (الکنهل وآخرون‎ .(Thubaity 
. (-Alkanhal et al 


أما القسم الثاني من الأغراض التي تبنى لأجلها المدونات فيتميز بشكل 
عام بتنوع موضوعاته ومحاولته الوصول إلى مدونة تستطيع الإجابة عن أسئلة 
متنوعة. ويندرج تحت هذا النوع من المدونات المدونات المرجعية. ومن أمثلة هذه 
المدونات المدونة اللغوية العربية لمدينة الملك عبدالعزيز للعلوم والتقنية. ومدونة 
آر تن تن arTenTen‏ على موقع سكتش انجن(۷) -Sketch Engine‏ 

فيما يلي شرح لأهم معاییر تصمیم الدونات التي جمع شتاتها سنکلیر 
bof od eie e deu)‏ اف کے اه E‏ 
المباشر على المدونة الشهيرة بنك اللغة الإنجليزية The Bank of English‏ مع 
بعض النقاش والرجوع إلى مراجع أخرى يتم الإشارة إليها 2 حينها حسبما 
تقضي الحاجة. وهذه المعايير هي: 

۳ لغة الدونه 

لا یقتصر تحدید لغة الدونة على التحدید العام للغة مثل کونها اللغة العربية 
أو الانجليزية. بل یتعدی ذلك إلى تحدید تفاصیل أكثر دقة. ومن أمثلة هذه 
التفاصيل أن تكون لغة المدونة هي اللغة الفصحى المعاصرة أو القديمة التراثية 
(إن جازت هذه التسمية) أو حتى اللهجات إن كان هذا هو مطلب الدراسة. كما 
bet oda Does t‏ تا ب أن نظن aal‏ ر tuus;‏ نها 
فاللغة العربية المعاصرة -على سبيل JELI‏ -على الرغم من أن لها ملامح عامة 
عند متحدثيها 2 البلدان العربية إلا أن هناك اختلافات واضحة على المستوى 
اللفظي -على الأقل- فيما بينهم. ومن أمثلة هذه الاختلافات اللفظية .2 
العربية المعاصرة بين لغة الصحافة السعودية والفربية كلمتا «بنوك» و «أبناك». 
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أو تداولها تجار با Wl‏ المدونات اللغوية العربية م 


تا — بناؤها وطرائق الإفادة منها 


۲۳ طبيعة النصوص 

تختلف الطبيعة التي تظهر فيها اللغة البشرية. فهي قد تكون منطوقة وهذا 
الأغلب وقد تكون مكتوبة Z‏ صور متعددة وقد تكون آیضا لغة إشارة؛ ومهما يكن 
الأصل الذي ظهرت فيه اللغة فيجب تحويل هذا الأصل إلى صورة إلكترونية 
قابلة للمعالجة الالية. و2 الأغلب فان هذه الصورة تكون على صيغة TXT‏ 

إن تحديد نسبة ما سوف تحتويه المدونة من نصوص منطوقة أو مكتوبة أو 
كليهما له أثر كبير على اختيار الأوعية والفترات الزمنية وكذلك 2 الجهد الذي 
سوف پستفرق 2 جمع محتويات الدونة. فالجزء المنطوق من المدونة يستغرق 
وقتاً أطول بکثیر 2 الحصول عليه ومن ثم تحویله إلى نص مکتوب مقارنة 
Asl edet eod‏ وتزداد الصعوبة لو كانت اللفة هي اللفة الفصحی. 
ناهيك عن التكلفة الادية الباهظة لذلك والاحترازات اللازمة لعدم خرق 
التخضوضية القتخصبية. 

۳ تاريخ النصوص 

تختلف الفترات الزمنية التي يجب أن تغطيها المدونة باختلاف الأغراض 
التي تبنى من أجلهاء فالمدونات التي تسعى لدراسة اللغة الحديثة أو المتخصصة 
عادة ما تتميز بقصر الفترات التي تفطیها . وتتراوح هذه الفترات من سنة إلى 
عدة سنوات. وعلى النقيض من ذلك المدونات التي تسعى لدراسة تطور اللغة 
إذ تتضمن Lapai‏ من فترات زمنية طويلة تتراوح بين عشرات السنين إلى 
cut‏ منها. وبالطبع فان طول الفترة الزمنية التي تغطیها المدونة يميزها عن 
غيرها من المدونات التي تغطي فترات أقصر وخصوصا فيما يتعلق بالمدونات 
المرجعية Reference Corpora‏ سواء كانت حديثة أو تاريخية. ويجب مراعاة أن 
تتضمن المدونة نصوصا تغطي جميع أجزاء الفترة الزمنية لا أجزاء متفرقة 
منها قدر الامکان. وتسعى بعض المدونات التي تهتم بأغراض مقارنة اللغة بين 
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فترة زمنية وآخری إلى تضمین نصوص من فترات زمنية مختلفة ومتباعدة 
مثل أن تحوي الدونة نصوصًا من السنوات العشر الأولى من القرنین العشرین 

۳ المنطقة الجغرافية 

یقصد با لنطقة الجفرافية هنا البلد أو البلدان التي صدرت فیها النصوص, 
وقد تستدعي الحاجة تحدید الناطق الختلفة داخل البلد الواحد نفسه. فعلی 
سبیل المثال لو كان الفرض انشاء مدونة لفوية تختص بالملكة العربية السعودية 
فإنه من الفترض الأخذ بعين الاعتبار جمیع مناطق الملكة. 

وكوف اک فا rat)‏ عون culo Gs aaa‏ وتان مود 
تتحدث نفس اللغة بحیث تکشف الاختلافات اللغوية والثقافية بين هذه البلدان 
أو الناطق. فعلی سبیل الثال لا يمكن لدونة أن تکشف عن الأنماط اللفوية 
الشترکة أو )تفه 3 3301 acad]‏ مالم تون تصيومنا سنجمه guu‏ 
العربية. ولکن التنوع 2 البلدان أو الناطق لیس شرطا Daly‏ بل إن الحاجة 

o.Y‏ الوعاء 


تظهر النصوص ئ أوعية مختلفة مثل الصحف والمجلات والكتب والرسائل 
الجامعية أو الشابكة, ولكل من هذه الأوعية سماته اللغوية العامة وخصائصه 
التي يمكن أن تميزه عن غيره على المستوى اللفظي والتركيبي. Ail‏ العلم 
ك الرسائل الجامعية والدوريات المحكمة تتميز بالدقة والوضوح واستخدام 
الصطلحات العلميةء ولا تستخدم الجاز. فلا يمكن التعبير عن فكرة أو معنى 
معين إلا بمصطلح واحد وثابت متفق عليه 2 الأغلب؛ بينما الحال مختلف 2 
لقة الصحافة والأدب مثلا. 
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إن تحدید أوعية Angle‏ لَضمّن ج الدونة يزيد من قیمتها وفائدتها 
لدراسات وتطییقات مختلفة بخلاف الدونات المنحصرة 2 وعاء واحد. وعلی 
العموم فان تعدد الأوعية یعد من علامات الدونات الرجعية 2 الأغلب. 


۳ الجال 


لكل وعاء من الاوعية مجالات تختص به وقد تظهر فيه فقط ولا تظهر 
2 غیره. فعلی سبیل المثال نجد الأخبار والقالات والتقاریر بوصفها مجالات 
مختلفة یمکن أن تکون 2 الصحف والجلات ولا یمکن أن توجد 2 الکتب أو 
الرسائل الجامعية. وتتنوع اللغة الستخدمة داخل الوعاء الواحد باختلاف 
مجالاته. فالدوریات العلمية الحکمة على سبیل الثال تعد sleg‏ يجمع عدة 
مجالات مختلقة مثل أصول الفقه والطب والهندسة, وعلی اثرغم من أن هه 
الجالات قد تتسم بطابع واحد عام وهو استخدام لفة العلم الا آنها تتفاوت ب 
طرق التعبیر والصطلحات الستخدمة. إن التباین 2 الأفكار بين هذه الجالات 
والطرق الستخدمة 2 التعبیر عنها يثري المدونة ویسمح بظهور الأنماط العامة 
للغة العلم وکذلك الانماط الخاصة بکل مجال. كما أن معرفة هذه الجالات 
وتحدید نسبتها من کل وعاء يساعد 4 التخطيط البکر لجمع نصوص الدونة 
وتیسیره فيما بعد. 

۳ حجم العينة 

2 هذا المعيار يتم تحديد ما إذا كانت المدونة سوف تتضمن نصوصا كاملة 
al‏ أجزاء من النصوص, ويوجد رأيان مختلفان بهذا الخصوص: فالرأي الأول 
يرى تضمين النصوص كاملة ما أمكن (سنکلیر ۲۰۰۵)؛ لأن وجود النص كاملا 
يزيد من فرصة ظهور خواص لغوية متعددة ومختلفة ومترابطة -2 سياقها 
الطبيعي. وك القابل يرى الرأي الثاني أن اختيار جزء من النص يزيد من 
تنوع مواد الدونة. ناهيك عن العوائق المتعلقة بحقوق الملكية الفكرية وصعوبة 
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الحصول على النصوص كاملة (ماير ۲۰۰۲). وعلى الرغم من ذلك فيجب 
عدم الاكتفاء بجزء واحد من النصء بل بأجزاء متعددة من آوله وأوسطه 
وآخره (ماكنري وآخرون .)3٠١5‏ وبطبيعة الحال فإن مثل هذا القرار له علاقة 
بالنصوص ذ ات الحجم الكبير مثل الكتب والرسائل الجامعية وليس النصوص 
ذات الحجم الصغير مثل نصوص الصحف. 

ومهما يكن فان تحديد حجم عينة النصوص مرتبط بحجم المدونة؛ فقد 
يكون من المناسب أن تكون عينة النصوص أجزاء من النص عندما تكون المدونة 
صغيرة الحجم ومن الممكن الوصول للحجم بهذه الطريقة. آما إن كانت المدونة 
كبيرة الحجم فالأولى تضمين النص کاملا. مع التأكيد على وجوب الحرص 
على استخدام نفس حجم العينة 4 جمیع النصوص ما أمكن. 

۳ حجم المدونة 

يقاس حجم المدونة بعدد كلماتها. والكلمة هنا تعني أي مجموعة متتابعة من 
الرموز لا يفصل بينها فراغ. وبالتالي فان بعض الكلمات -حسب هذا التعريف- 
قد تكون كلمة معروفة وصحيحة مثل «کتاب». أو قد تكون أرقاما »^ VY‏ أو 
كلمات ليس لها معنى «ععخعج» أو كلمات تحوي أخطاء طباعية «كعنبوت» أو 
كلمات تمت إضافة الکشیدة(۸) 4# وسطها «بسم». وبالتالي فان «بسع» 
وبسم» تعدان كلمتين مختلفتين بالنسبة لأدوات معالجة المدونات لاختلاف 
شكليهما على الرغم من كونهما كلمة واحدة. مثل هذه الأمثلة موجودة 2 أغلب 
المدونات خصوصا الكبيرة منهاء ونسبتها إلى إجمالي حجم المدونة لا يذكر 
ولكن الإشارة إليها لازمة لفهم معنى الكلمة التي بناء عليها يتم قياس حجم 
المدونة. 

ولا بد من التنبيه على أن الآراء تتفاوت حول حجم الدونة. فهناك من 
یری أنه كلما ازداد حجم المدونة كان ذلك أفضل (سنکلیر ۱۹۹۱ «(Sinclair‏ 
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والسبب 2 ذلك أن أغلب كلمات المدونة لا تتكرر بالشكل الكالك؛ ولذا فإنه كلما 
oa eoe dad al‏ ان اغا e‏ شاه رخا وبع dis‏ يرف 
عدد من الباحثين أن مدونة بحجم مليون كلمة كافية للابحاث اللغوية التي 
تبحث عن الظواهر العامة # اللغة (انظر مناقشة هذا الموضوع .2 السليطي 
وأتول» (Y‏ 

كما أن حجم المدونة يتعلق بنوعية العمل أو الدراسات الطلوية. فالمدونات 
المتعلقة بالدراسات المعجمية تتطلب حجما أكبر مقارنة بالمدونات المتعلقة 
بالتراكيب النحوية. وقد ساعد التطور الحاصل + تقنية المعلومات والتوفر 
المتزايد للنصوص الإلكترونية على بناء مدونات لغوية كبيرة بصورة أسهل من 
ذي قبل. 

وبشكل عام» فان التحديد الدقيق للحجم LIS‏ لتحقيق الفرض الذي من 
أجله تبنى المدونة al‏ صعب للغاية ولا توجد معادلة رياضية لذلك؛ بل يخضع 
بشكل كبير للخبرات السابقة لمصمم المدونة بالإضافة إلى الخبرات المنشورة 
4 هذا الجال مما هو مقارب لغرض المدونة ويتضح بصورة أكبر بعد استخدام 
المدونة. 

ويمكن تحديد نسبة أو عدد الكلمات التي تمثل كل معيار من معايير تصميم 
المدونة بطريقتين: الطريقة الأولى تعتمد على التوزيع من الأعلى إلى الأسفلء 
حيث يتم تحديد الحجم الكلي للمدونة اللغوية ثم تحديد نسبة الجزء المكتوب 
والمنطوق منهاء يتبع ذلك تحديد النسبة المناسبة لكل وعاء من آوعیتها. ثم يتم 
تقسيم هذه النسبة على مجالات الوعاء ثم موضوعاته. يتبع ذلك تحديد نسبة 
كل فترة زمنية ومنطقة جغرافية إن كانت المدونة تغطي عدة بلدان وفترات 
زمنية مختلفة. ويمكن بدلا من ذلك توزيع الحجم الكلي للمدونة على الفترات 
الزمنية ثم البلدان ثم الأوعية والمجالات والموضوعات. 
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أما الطريقة الأخرى فتعتمد على التوزیع من الأسفل إلى الأعلى؛ فیتم فیها 
تحدید aae‏ الکلمات الناسب لكل موضوع ونسبة کل ab‏ وفترة زمنية من هذا 
الوضوع. وبالتالي فان مجموع عدد کلمات كل موضوع يعطي العدد الاجمالي 
للمجال. ویکون مجموع عدد کلمات کل وعاء هو مجموع عدد کلمات کل مجالاته. 
وبذلك یمکن تحدید الحجم الكلي للمدونة اللفوية بجمع عدد کلمات کل وعاء 

۳ معاییر آخری 

إن العاییر السابقة عد آهم العاییر التي یجب Lang‏ الحسبان عند 
تصمیم الدونة. وهناك معاییر آخری يجب اعتبارها 2 بعض الدونات حسب 
s‏ الف مق اجه تم قاتا من شم ابر dass‏ جن اف 165 
أو آنثی. وکم النسبة التي يجب أن تحتویها الدونة من نتاج کل من الجنسین. 
ومثل هذا المعيار مهم عكري کی ds Es Loo i qa‏ بت eiie‏ 
الرجال والنساء. ومن الأمثلة الأخرى تحديد الفئّة العمرية والمستوى التعليمي 
والاجتماعي أو حتى عدد المتابعين للمغرد إن كانت المدونة تدرس لغة الخطاب 
-2 تويتر olas Twitter‏ المعايير التي تم ذكرها إنما هي أمثلة فقط لبعض 
المعايير الخاصة التي يتطلبها تصميم مدونات ذات مواصفات وأغراض خاصة 
ولا تعني الحصر. 

۳ التمثيل والتوازن 


القصود بالتمثیل هو قدرة الدونة على تمثیل اللفة أو صورها الختلفة محل 
الدراسة؛ ویری ماكنري وآخرون )1 (Y*‏ أن ما يميز الدونات عن أي مجموعة 
عشوائية من اللصوص هو قدرتها على تمثیل اللغة ومتغیراتها. ویرتبط التمثیل 
ارتباطاً وثيقاً بحجم الدونة والتتوعات الختلفة فیها ونسبة كل تنوع. فکلما زاد 
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الحجم والتنوع كانت قدرة الدونة آکبر على تمثیل اللفة والاجابة عن أسئلة 
الدراسة. 


Lal‏ القصود بالتوازن فهو أن تمثل نصوص الدونة الواقع اللفوي كما هو 
2 خارجها فلا تکون منحازة لحتوی أو مستوی دون آخر. ولیس بالضرورة 
أن يعني ذلك التساوي 2 حجم ما تحویه الدونة من کل sleg‏ أو مجال الا 
ان كان alis‏ لازما متها هو اتحال ك الدراسات القارنة. :فلو نظرتا gn‏ 
الكتابي خارج الدونات فسنجد أن الغلبة للصحف مقارنة بالرسائل الجامعية, 
وعلی هذا يجب أن یکون حجم الصحف من آوعية الدونة الرجعية آکبر من 
الوساكل aal]‏ حصي الواض فاد وكذلك sf‏ هقی الوم sil‏ د 
لمواد الدونة, فالدول التي تتميز بنتاج أكبر يجب أن يكون لها النصيب الأكبر 
من الحجم بحسب الواقع. وعلى الرغم من أن هذا الكلام صحيح 3 مجمله 
لكننا لا نستطيع أن نحدد بدقة تامة مقدار النسبة لكل جزء من محتوى المدونة. 

إن التمثيل والتوازن مفهومان مهمان ومرتبطان لا يمكن فصلهما عن 
بعضهما. ويتحققان بشكل كبير عند مراعاة جميع المعايير السابقة بحسب 
الغرض من المدونة. وقد حظي هذان المفهومان باهتمام بالغ -ولا زالا- .2 
كثير من الدراسات التي تناقشهما وتعرض العديد من وجهات النظر حولهماء 
انظر على سبيل المثال (سنکلیر (VAAN‏ ( أتكنز وآخرون ۰۱۹۹۲ (-Atkins et al‏ 
(يايبر ۰۱۹۹۳ (Biber‏ (بایبر وآخرون ۱۹۹۸ء (.Biber et al‏ (ليتش ۰۲۰۰۳ 
(Leech‏ . وبسیب الاختلاف الكبير حول سبل تحقيق التمثيل والتوازن كانت دقة 
تمثيل المدونات الكبرى الشهيرة AU‏ الانجليزية. كالمدونة الوطنية البريطانية 
British National Corpus‏ محل تساؤل عند بعض الباحثين (أحمد ۰۲۰۰۸ 
(Ahmad‏ . وللتغلب على هذا الإشكال وصعوبة تحقيقه فعليا بشكل كامل اقترح 
تيوبرت وكيرماكوفا ( تیوبرت و کیرماکوفا ۰۲۰۰۷ Teubert and Cermáková‏ ( 
استخد ام المدونات السانحة ‘Opportunistic Corpora‏ |> تمتاز الدونات 
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السانحة بميزتين رئیستین. أولاهما: أنها كبيرة الحجم يجمع فيها كل ما يمكن 
جمعه من نصوص مختلفة. وثانيهما: أنها توفر معلومات تفصيلية شاملة عن 
تمثل من وجهة نظره التمثيل والتوازن لدراسته التي يرغب القيام بها. 

ومهما تكن وجهة النظر حيال التمثيل أو التوازن فإنني أرى أنه لا توجد 
مدونة لغوية ممثلة للغة وصورها المختلفة بشكل کامل. وأن ما يمكن الحكم عليه 
بشكل آدق هو قدرة المدونة على تمثيل موضوع الدراسة أفضل من غيرها من 
المدونات الأخرى. 

١١ ۳‏ البيانات الأساسية للنصوص 

البيانات الأساسية للنصوص شبيهة إلى حد كبير بالمعلومات الببليوغرافية. 
وتحديد هذه المعلومات الأساسية وتوفیرها للباحثين مع نصوص المدونة يساعد 
2 إدارة المدونة. وتحديد مدى مناسبتها لغرض الدراسة بشكل كبيرء وكذلك 
يمكن الاستفادة منها 4 تحديد الأجزاء الأكثر مناسية للدراسات اللاحقة 
والاكتفاء بهاء كما تساعد البيانات الأساسية لللصوص .2 الاستفادة من 
المدونة 4 المستقبل 2 بناء مدونات لغوية أخرى تتضمن هذه المدونة بكاملها 
أو gd‏ منها. 

تشمل البيانات الأساسية للنصوص العلومات التالية وليست حصرا عليها: 

اسم المؤلف وجنسیته وجلسه. 

وعاء النص ومجاله وموضوعه. 

تاريخ صدور النص. 
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مصدر النص. 


بناء المدونات 
الأخذ بالاعتبار إجراءات عدة تسبق الجمع وتلیه. وفيما يلي سوف نوضح هذه 
الخطوات مع إعطاء نماذج لما يمكن أن تتضمنه هذه الخطوات: 

۳ أ حقوق الملكية الفكرية 

إن حقوق الملكية الفكرية لنصوص المدونة هي أول ما يتوجب النظر إليه 
بحرص قبل الشروع -2 بناء المدونة؛ إذ إن انتهاك حقوق الملكية الفكرية لمالكي 
النصوص -جهات أو آفرادا- قد يعرّض الشخص أو الجهة المسؤولة عن بناء 
المدونة للمساءلة القانونيةء وقد یجهض المشروع برمته Jac. Listas:‏ توزيع 
نصوص المدونة سواء بمقابل أو بالمجان. وعلى الرغم من أهمية هذا الموضوع 

قبل التفكير 2 الحصول على إذن مسبق لتضمين النصوص ال محمية بقوانين 
انتهت مدة حمايتها النظامية بموجب القانون؛ والنصوص التي ينص أصحابها 
على مجانية الحصول عليها وتوزيعهاء وكذلك ما توفره بعض الجهات الرسمية 
من اصد ارات ونشرات تعريفية وتثقيفية. 

وتتص بعض قوانین حماية الملكية الفكرية على عدم خضوع بعض النصوص 
للحماية. فعلی سبیل JEL‏ فان نظام حماية حقوق المؤلف ولائحته التنفیذیة(٩)‏ 
2 المملكة العربية السعودية ينص على استشاء بعض الصنفات من الحماية, 
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كالأنظمة والأحكام القضائية والوثائق الرسمية وما تنشره الصحف والجلات 
من الأخبار اليومية أو الحوادث ذات الصبفة الاخبارية. كما تسمح بعض 
الأنظمة بالاستفادة من النصوص كاملة أو أجزاء منها لأغراض تعليمية أو 
بحثية. ومع هذا السماح بالاستفادة من النصوص إلا أنها لا تهمل وجوب 
الإشارة إلى اسم صاحب الحق 3 ملكية هذا النص. وقد لجأت بعض المدونات 
كبيرة الحجم إلى الاستفادة من هذا النظام. فلا تسمح بتوزيع نصوص المدونة 
ولا تعرض نصوصها للاطلاع بل تعرض السياقات التي تظهر فيه الكلمة فقط 
مع الإشارة الى مؤلف النص وكافة العلومات المتوفرة عن هذا النص 2 المدونة. 

وعندما تدعو الحاجة للحصول على إذن بتضمين نصوص محمية بموجب 
النظام. كحقوق الملكية الفكرية أو نصوص قد تنتهك الخصوصية الشخصية, 
كحوارات المرضى مع آطبائهم. يجب أن يفرق القائمون على المدونة بين 
موضوعين رئیسین؛ والحصول على الإذن بهماء وهما حق تضمين النصوص 2 
المدونة. وحق توزیع أوفشرهذة النصوص مجانا أوبمقابل مادي. 


۳ ب نحدید الصادر 


إن تحدید الصادر التي یمکن أن تجمع منها نصوص الدونة یوفر الکثیر 
من الوقت والجهد عند القیام بالخطوة التالية وهي جمع النصوص.ء ویمکننا 
تقسيم هذه الصادر إلى قسمين رئیسین. الأول: المصادر التي lou dis‏ 
الكترونية للجمع وللمعالجة الباشرة. مثل: مواقع الصحف والمجلات والمكتبات 
الالكترونية التي توفر نصوصا بصيغة نصية (DOC, DOCX, TXT)‏ . والاخر: 
الصادر التي توفر نصوصا قابلة للجمع ولکنها غير قابلة للمعالجة الالکترونية 
مباشرة. بل calla‏ جهدا |ضافیا لتحویلها لصيغة نصية. كأن تکون نصوصها 
على صيفة صور أو PDF‏ أو أن تکون ورقية. ویمکن 2 هذه الحالة استخدام 
برامج التعرف الضوئي على الحروف لتحویلها إلى صيفة نصية الكترونية أو 
كتابة اللص وحفظه بصيغة نصية. 
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ويتطلب تحديد المصادر إعداد قائمة بها وبروابطها الإلكترونية على الشابكة 
أو طريقة الحصول عليها إن كانت ورقية. مع تسجيل أي ملاحظات تخص 
رخص الحصول علیها. وتضمينها 2 المدونة. وتعتبر هذه القائمة. قائمة 
يجب اختبارها وتجريبها وجمع نصوص متعددة منها؛ لمعرفة الأفضل MS‏ 
2 جمع اللصوص. كما يجب الإضافة إليها وتنويعها بقدر الإمكان وحذف ما 
لا يصلح منها لاي سبب. كعدم توفر معلومات دقيقة عن النصوص مثل نسبة 
نص لغير صاحبه. 

۳ الجمع 

اا ois‏ تقاقية | تشادن ال که تحديدها Vas‏ رودا xs dc dal‏ 
نصوص الدونة. وتوفیراً للوقت والجهد والتکلفة يجب الترکیز على القسم 
الأرن من الصادر (الصادر التي توفر نصوصاً الکترونية للجمع وللمعالجة 
الباشرة) وعدم العمل على القسم الثاني (الصادر التي توفر نصوصا قابلة 
للجمع ولکنها غير قابلة للمعالجة الالكترونية الباشرة) الا 2 آضیق الحالات. 
ومن الممكن -2 بعض الحالات أن يتم جمع القصوص Ll‏ حیث توجد عدة برامج 
يمكن أن تقوم بهذا العمل كبرنامج بوت كات )+ BootCat(‏ على سبيل JÈU‏ 
tuas‏ وقى ان هه o‏ و والكامل ام كن saa‏ ان 
على سبيل المثال (الزهراني ۰۲۰۱۳ (Alzahrani‏ (خوجه ۰۲۰۰۹ (Khoja‏ 
( جاكوبيكيك وآخرون ۱۳ + -Jakubí&ek et al «Y‏ ) . ومع ذلك» يجب التنبه إلى أن 
نتاج الجمع الالي للنصوص بحاجة الج شرا Ses‏ قیقة؛ فبعض هذه اللصوص 
قد یکون ما cela MI‏ وبعضها قد یکون مكررا أو يحتوي على بيانات ليس لها 
علاقة بالنص الأصلي» کروابط لصفحات آخری أو اعلانات تجارية أو بیانات 
لها علاقة بموقع الشابكة. وعلی الرغم من فائدة الطريقة الالية 2 الجمع 
السریع لنصوص الدونة إلا أنه من الصعب تحدید الاوعية الخاصة بالنصوص 
ومجالاتها والتواریخ التي ظهرت فیها ومن هم مؤلفوهاء لذا فان تعيين الواقع 


yw 
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التي تجمع منها النصوص لتحدید الأوعية والوضوعات يجب أن یکون محل 
e A e‏ 

الاهتمام. ولضمان جودة نواتج عملية جمع النصوص يفضل ان تجزا عملية 
الجمع إلى مراحل يتم تقسيمها بناء على الأوعية مثلا. وكلما انتهى قسم تتم 
۳ د الترميز والتسمية والحفظ 

بعد جمع التصوص:. ولزيادة الاستفادة من المدونة وتسهیل ادارتها من 

توحيد ترميز النصوصء ومن المفضل تحويلها كاملة إلى ترميز واحد 
يكون مقبولا من أغلب أنظمة التشغيل وبرامج معالجة المدونات. UTF8: Eis‏ 
و ۰17116 فاستخدام ترميز الوندوز Windows‏ مثلاً قد لا يساعد على 
الاستفادة من المدونة 2 حال معالجتها بأنظمة مختلفة عن الوندوز. 


توحيد طريقة التسمية. ومن الفضل استخدام طريقة تعتمد على الأرقام 
ره فرشا يعن هشیم انيه esti‏ الى عدو ا نيلها 
«-» حيث تعبر كل خانة منها عن آحد معايير التصنیف. فيكون لكل بلد ووعاء 
ومجال وموضوع وفترة زمنية رمزه الخاص وتكون آخر خانة للرقم التسلسلي 
للملف. 

حفظ الملفات -2 مجلدات منفصلة حسب وعائها أو فترتها الزمنية أو البلد 
الذي صدرت فيه مع حفظ القائمة المشتملة على اسم النص ومعلوماته حسب 
اين الت واد كن التدونة کیره الجسم وى 1535 1548 
من النصوص فقد يكون من الأفضل حفظ النصوص وبياناتها الاساسية 2 
قاعدة بیانات. ليمكن عند ذلك إدارتها والتحكم فيها بسهولة. كما يمكن بهذه 
الطريقة تصديرها بصيغ متعددة حسب الرغبة متى ما دعت الحاجة إلى 
دلك . 
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۳ ه التحشية 

من الستحسن -وقد يكون لازما 2 بعض الحالات- أن ex‏ إخراء'تضوض 
المدونة بمعلومات تزید من فاقدتها. وتساعد 2 اجراء الزید من الدراسات 
التعمقة. وتقسم هذه المعلومات إلى ثلاثة آقسام: 


القسم الأول: يتضمن معلومات عن النص نفسه وهي التي أطلقنا عليها 
من قبل مسمى البيانات الأساسية للنصوص, ويتم ذلك باتباع عدة منهجيات 
وأساليب معيارية تساعد 2 تبادل المدونات وسهولة استخدامها بين الباحثين. 
ومن أبرز هذه المعايير مبادرة ترميز النصوص(١١) Text Encoding‏ 
(Initiative (TEI‏ والمرجع القياسي لترميز الدونات(۱۲) Corpus‏ 
(Encoding Standard (CES‏ . وهناك من يرى أن هذا القسم ليس له علاقة 
بالتهشية فیضم له مضطلها آخر sas‏ التعلیم (من العلامة) Mark-up‏ 
(ماكنري وآخرون. (QC‏ 

القسم الثاني: معلومات تتعلق ببنية النص وترکیبه الظاهریین. مثل تحدید 
نهاية وبد اية الفقرات والجمل والعبارات داخل النص. وهذه التحشية تساعد 2 
الدراسات التي تنظر ب العلاقات بين الجمل 2 الفقرات الواحدة وبين الفقرات 
2 النص ذاته. كما تكون TA‏ لبناء البنوك الشجرية Treebanks‏ والتحلیل 
النحوي 8( ویمکن آیضا كما 2 حالة الأوراق العلمية مثلا تحديد بداية 
ونهاية الأجزاء الكونة للورقة العلمية مثل العنوان والکلمات الفتاحية والقدمة 
والدراسات السابقة والتجارب ومناقشة النتائج والخاتمة. ومثل هذه التحشية 
تفيد ‏ الدراسات التي تستهدف معرفة الخواص اللفوية لثل هذا النوع من 
الکتابات وکیف تترابط أجزاءها. 

القسم الثالث: ما یتعلق باضافة نتائج التحلیل اللغوي للنصوص کاضافة 
الوسوم النحوية والوسوم الدلالية واضافة معلومات الاحالة بين الضمائر 


هكا 


Wi‏ المدونات اللغوية العربية 
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والأسماء وكذلك معلومات التحليل النحوي. وعلاوة على ذلك يمكن للمدونات 
اللفوية العربية أن تشمل تحشيات من نوع آخرء كالتحشية الخاصة بالجذور 
وأنواعها والتوسيم الصرق. ويجب التنويه إلى أن هذا النوع والأنواع الأخرى 
من التحشية يجب أن تتبع منهجا واحداً ودقیقا 3 تحدید معلومات التحشية 
وذلك بوضع قاگمة محددة Lila‏ فلا پستخدم غیرها ولا تهمل إن وجدت. 

وبطبيعة الحال. فان عملیات التحشية 2 القسمین الثاني والثالث یمکن 
أن تتم بصورة آلية. وهذا هو التبم 2 غالب الدونات الانجليزية بسبب دقة 
مثل هذه الأنظمة الالية 4 اللفة الإنجليزية؛ ولکن الحال 2 العربية مختلف. 
فالأبحاث 2 هذا الجال محدودة والوجود منها لا يراعي ما هو مستقر .2 
aei‏ المزیی (V ME coul) E‏ وعلی اغ مق ضف فالاسگادو من 
آنظمة التوسیم النحوي التوفرة حالیا ممكنة وقد تکون ذات فائدة متی ما 
أدرك الباحث جوانب E CONES‏ على قائمة الوسوم النحوية 
شم رانا E Las‏ رقا لگ ره العف 


الاادوات 

مهما كانت الجهود والاوقات والأموال التي تصرف 2 تصمیم الدونة وجمع 
نصوصها لتوائم التصمیم فانها ستکون بیانات بلا فائدة مالم يكن هناك آدوات 
قادرة على البحث فیها واستعراض نتائج هذا ان الا موی زد 
legis‏ للنظر آولاً مدی تحقیق الدونة لفرض الدراسة. ولاجراء التحلیلات 
Sa a‏ على اناا Lats‏ وسوف تستغرض باختصار آهم الوظائت 
اللازمة 2 آنظمة معالجة الدونات وهي كما يلي: 

أ - انتاج بیانات إحصائية عامة عن الدونة. کحجمها. وعدد کلماتها دون 

تکرار. وعدد نصوصها. 


۱۹۹ 
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ب - انتاج قوائم التكرار والتكرار النسبي للمدونة للغوية كاملة. والتوزيع 
الإحصائي لتكرار الكلمات على أقسام المدونةء مثل: الأوعية والفترات 
الزمنية والمناطق إن كان مثل هذا التقسيم موجودا. ويقصد بالتكرار 
عدد مرات ظهور الكلمة 2 المدونة. ويقصد بالتكرار النسبي نسبة 
ظهور الكلمة 2 المدونة مقارنة ببقية كلماتها. ويتم احتساب التكرار 
النسبي بقسمة تكرار الكلمة 2 المدونة على كامل حجم المدونة. 
ويستفاد من التكرار النسبي عند مقارنة التوزيع الإحصائي للكلمة بين 
مدونات مختلفة الأحجام. 

ج - استخراج الكلمات الدليلية أو المميزة للمدونة اللغوية وذلك بمقارنة 
قوائم التكرار لكلمات لمدونة اللغوية مع قوائم التكرار لمدونة لغوية 
آخری تسمى اصطلاحا بالمدونة المرجعية. وبالإمكان إجراء هذه 
المقارنة أيضا على مستوى الوسوم النحوية والدلالية والصرفية متى 
ما كانت متوفرة والوسوم المستخدمة 2 المدونتين متطابقة. 

د - إنتاج قوائم الكشاف السياقي للكلمة مناط البحث. والقصد من الكشاف 
السياقي هو استعراض جميع السياقات التي وردت فيها الكلمة داخل 
المدونة للكشف عن معانيها الختلفة. والكلمات التي تظهر بصحبتها 2 
السیاق. واختلاف المعنى من سياق لآخرء باختلاف الأوعية والفترات. 
ومن المناسب توفر إمكانية تحديد عدد الكلمات التي يتضمنها السياق 
قبل الكلمة مدار البحث وبعدها. 

ه - حسابات التصاحب اللفظي لكلمة معينة من خلال عدة معاملات 
احصائية (Es‏ مربع Chi-Squiredicls.‏ — ومعامل كسب المعلومات 
Information Gain‏ ومعامل المعلومات المتبادلة Mutual Information‏ 
ومعامل الاحتمالية اللوغاريثمي Log Likelihood‏ على سبيل المثال لا 
الحصر. ولا يشترط أن يكون الباحث على معرفة بالخلفية الرياضية 


۱۷ 
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لهذه المعاملات الإحصائيةء ويكفيه معرفة متى يستخدم هذه المعاملات 
وحدود استخدامها. وتسعى هذه المعاملات الإحصائية إلى الكشف عن 
مدى ارتباط الكلمة مع الكلمات الأخرى التي ظهرت معها 2 السیاق. 
ولا يشترط 2 هذا الحساب أن تتوالى الكلمتان: بل أن تظهرا 4 سياق 
واحد حسبما يحدد الباحث حدود هذا السياق. ويمكن استخدام نفس 
العاملات الذكورة سابقاً لحساب التلازم اللفظي بين کلمتین ( أن تظهر 
الكلمة الأولى قبل الثانية مباشرة) مع تغییر طفیف 2 طريقة يقة الحساب. 
شرا exis‏ افو مس ای Edda‏ رس فإنه يمكن 
حساب التصاحب أو التلازم النحوي أو الدلالي أو الصرق. 
تتوفر عدة برامج مجانية وآخری بمقابل مادي للقیام بهذه الوظائف وغیرها. 
ومن أشهر البرامج ج المجانية لمعالجة المدونات برنامج آنت AntConc ۱۱۲ james‏ 
ولكنه لا يراعي اتجاه الكتابة العربية (من اليمين لليسار) أثناء عرض الكشاف 
السياقي. ولم يصمم نظام لمعالجة المدونات العربية يراعي خواصها ويحتوي 
كل ما ذكر أعلاه من وظائف سوى أداة معالجة المدونات العربية «غواص»(۱۶) 
(الثبيتي وآخرون. ۲۰۱۳ (.Al-Thubaity et al‏ الذي تم تطويره 2 مدينة 
الملك عبدالعزيز للعلوم والتقنية. وعلى الرغم من أهمية ما توفره هذه الأدوات 
والبرامج من معلومات وبيانات إلا أن هذه المعلومات والبيانات ليست هي نهاية 
البحث اللغوي بل بدايته؛ ومهمة الباحث بعد ذلك هي الكشف عما تعنيه هذه 
البیانات من خلال تفحصه ودراسته لها. 


مركن sa‏ لشي الا تا مسا اة القن نيع ر PE E‏ 
بتصميم المدونات وينائها. وقد تختلف معي عزيزي القارئ 2 التفاصيل التي 
سوف أضعها لمعايير التصميم أو لبناء المدونةء وهذا jal‏ طبيعي. ومرد هذا 
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الاختلاف - إن وجد - لسببين: الأول اختلاف الفهم للغرض من المدونةء والآخر 
ی 

بداية سوف أحدد سوال البحث أو الغرض الذي لأجله سوف آستخدم الدونة 
ثم أبحث عن مدی توفر مدونة لفوية بالامکان استخدامها للإجابة عن سوال 
الیحت. 

إن الفرض الذي حددته لاستخدام الدونة هو الکشف عن الفروقات 2 
استخدام اللفة بين الکتاب السعودیین والکاتبات السعودیات من خلال ما ينشر 
2 الصحافة السعودية. وللاسف لم آجد أي مدونة لغوية یمکن أن تساعد 2 
به سوف آضطر إلى بناء مدونة لفوية یمکنها الاجابة عن استفساراتي بهذا 
الخصوص. فیما يلي سوف آعرض للمعاییر التي اخترتها لتصمیم هذه الدونة: 


أ-لغة الدونة: العربية الفصحی. 

ب - طبیعة اللصوص: النصوص المكتوبة. 

ج - تاريخ النصوص: Y M‏ 

د - المنطقة الجفرافیة: الملكة العربية السعودية. 

ه - الوعاء: الصحف. 

و - الجال: القالات. 

ز - الوضوعات: القالات الاجتماعية. والثقافية, والدينية. وقد اقتصرت هنا 
على هذه الجالات الثلاثة لأنه من المکن وجود کتابات لكلا الجنسین 


۱۹۹ 


هذه الطيعة 
Maus d‏ ۱۹ المركر 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 
î‏ 


فيها بينما يصعب هذا 2 مجالات أخرى مثل السياسية. والرياضية. 
والعلوم والتقنية. 

ح - حجم المینة: التص کاملا. 

da‏ - جنس الکاتب: الذکور والاثاث. 

ي - حجم الدونة: ثلائة ملایین كلمةء توزع بالتساوي بين الجالات وبين 
الجنسین مثلما هو موضح 2 الجدول (۱) 


و[ س | ست سس | 


ك - معاییر آخری: قد يكون من الفید تحدید معاییر آخری مثل الستوی 
التعليمي والفئة العمریة؛ لکن الوصول لهنه العلومات وتحدیدها بدقة 


صعب جدا. 


ل - التمثیل والتوازن: كما تم توضیحه سابقاً فان التمثیل والتوازن مفهومان 
مهمان ومترابطان, وقد حققت الدونة الان من خلال التوزیع التساوي 
لعدد الکلمات بين الجالات وبين الجنسین. وعلی الرغم من غلبة عدد 
الكتاب على الكاتيات 4 الصحافة السعودية و2 الصحف TR‏ الا 
أن التساوي .2 توزيع عدد الكلمات والمجالات مهم اد 
المقارنة بين كتابات الجنسين وليس أي نوع آخر من الکتابات. كما تحقق 


| aula هلد‎ 


اخداء من mu 5$ A!‏ 
ولايسمح بنشرضا ورقیا -— 8 
أو تداو لیا تسار با Wl‏ المدونات اللغوية العربية 
2 — بناؤها وطرائق الإفادة منها 


التوازن من خلال حصر الجالات واقتصارها علی الجالات التي من 
المکن وجود کتابات صحفية للجنسین فیها بسهولة. وتحقق التمثیل من 
خلال تنوع الجالات ومن خلال اعتبار الصحف السعودية جمیعها. 

م - البیانات الأساسية: سوف آذ کر هنا جمیع البیانات الأساسية حتی ما هو 
يدهن منها. والفرض من هذا هو الاستفادة الكاملة من الدونة لاحقا 
فيما لو تم إضافتها لتکوین مدونات آخری لنفس الفرض لکن تفطي 
فترات زمنية آخری أو لتفطي بلدانا عربية آخری. والعلومات الأساسية 
القترحة لنصوص لدونتنا هذه هي: عنوان النص, اسم المؤلف» جنسية 
المؤلف» جنس الولف. وعاء النصء مجال النص» موضوع النص. تاريخ 
صدور النص بالیوم والشهر والسنة. اسم الصحيفة. الرابط الالكتروني 
للنص. تاريخ اضافة النص للمدونة اللفوية. 


بناء المدونة 

آ کی Qe T‏ المكريف كبا آ کوت سا 'إلن ام اتا کے ق 
كما أن الرغبة 2 تعميم الاستفادة من المدونة واتاحتها للباحثين الآخرين 
الصحف قبل البدء 2 جمع نصوص الونة اللغوية. بالطبع قد تأخذ هذه 
المرحلة بعض الوقت ولكن الإجابة بالقبول هي الفالبة. وعلى الباحث أن 
يدرك أهمية متابعة الموضوع والاتصال الدائم بالصحف وتوضيح فكرته 
ليحصل على الموافقة؛ كما يجب عليه ألا ينسى شكر الصحف وذكر 
موافقتها على ضم نصوصها لمدونته مع أهمية احتفاظه بنسخة من هذه 
الموافقة وإرفاقها مع المدونة. 


Y 


هذه العظبعة 
IET‏ من المركر 
ولايسمح بنشرها Led pg‏ 
او تداولها Le dum‏ 
ود 


o ca‏ تحدید الضادر: الجذول (Y)‏ پوضم Misa‏ المصنادو الى سیتم. جت 
نصوص الدونة منها ویمکن السیر على منواله لتحدید بقية الصحف. 
مع العلم أن العلومات الواردة 2 خانة موافقة الصحيفة هي معلومات 
افتراضية ولیست حقيقية. 

چ - الجمع: سیتم جمع نصوص الدونة بدو من مواقع الصحف بسبب آن 
الدونة صغيرة. كما أن تحدید جنس الکاتب آليا وتجهیز آحد البرامج 
لجمع نصوص کاتب معين یستفرق وقتأ طویلا. ویمکن أن یقوم بهذا 
العمل عدة آشخاص یتولی کل منهم جمع النصوص من صحيفة معينةء 
ویجب الحرص على تنوع الکتاب والکاتبات وعدم الاقتصار على کتاب 
وکاتبات بعینهم. 

د - الترمیز والتسمية والحفظ: يتم حفظ النصوص + ملفات نصية بصيغة 
TXT‏ بترمیز dias. uy UTES‏ تصوسن الكتاب کے مجلد باشم 
/_۱۵(۹۳). والکاتبات 2 مجلد باسم .(Y1)SNP F‏ بالنسبة 
لتسمية اللفات سوف نقسم الاسم إلى ۵ آجزاء كما هو موضح 2 
الجدول (Y)‏ 


م |الصحيفة | العنوان الوقع على الشابكة موافقة 
الصحيفة 


http://www.alriyadh. الرياض المملكة العربية السعودية = الریاض.‎ ١ 
comi حي الصحافة أول طريق القصيم‎ 
۱۱۶۲۱ ص.ب ۸۵۱ الرياض‎ 
سنترال: ۲۹۹۲۰۰۰ فاکس:‎ 
EAYN ye 


۱۷ 


شنه ۱ ار وق 


إشداء من المركز 
LE‏ بنشرها ورقيا 8 8 
أو تداو نها تجاريا Wl‏ المدونات اللغوية العربية 
د بناؤها وطرائق الإفادة منها 


مكتب صحيفة مكة الركيسبي 2 مكة http://www.‏ تم إرسال الخطاب 


المكرمة: صندوق بريد: ۵۸۰۳ الرمز makkahnewspaper.‏ 
البريدي: ۲۱۹۵۵ — 
تليفون: ۰۹1۲۱۲۵۲۰۲۷۷۲ فاکس: 

AM ۵ 


http://www.alyaum. ۰۹۱۱۳ ۸۵۸۰۸۰۰ السنترال:‎ 
com ATT ۳ ۸۵۸۸۷۷۷ الفاكس:‎ 


الرقم المجاني: ۸۰۰۱۲۱۲۱۲ 
ص.ب. ۵1۵ الدمام ۰ ۰۳۱۶۲۱ المملكة 
العربية السعودية 


mail&alyaum.com 


آبها - مدينة سلطان ۰ طریق الطار 
التحریر- هاتف 
( ۰۲۸۰۰۷۵۰۰۰۷ 


http://www.alwatan. 


YYVY VOY فاكس التحرير‎ YYVYYYY 


> ص.ب. ۱۵۱۵۵ 


جدول (Y)‏ مصادر الدونة 


كه كك 


جدول (Y)‏ تسمية ملفات المدونة 


۱۷۳ 


هذه الطبعة 
اخداء من المركر 
والايسمح Li piia‏ ورقيا 
او تداو لیا تسا با 
î‏ 


لو نظرنا لاسم الملف التالي ۲-۲۰۱۶-]/۰۰۹۱-۰-1 لعرفنا أنه ASIS‏ 
وآن موضوعه ثقابق. وأنه من صحيفة الوطن السعودية. وآن تسلسله 2 الدونة 
هو A Y‏ وسوف تحفظ جمیع العلومات الأساسية للمدونة اللغوية 2 قائمة كما هو 
موضح 2 الجدول (۶) 


إلى الساخرين نش 3 243 ۱ http://www.‏ 


alwatan.com.sa/ من التراث!! بدالا‎ 
Articles/Detail. 
aspx?ArticleId 


http://www. 
alyaum.com/ 


article/4013773 


جدول )£( المعلومات الأساسية للمدونة اللغوية 
الخاتمة 
المدونات ما هي إلا بيانات لا تختلف عن أي بيانات أخرى تجمع لإجراء 
الدراسات العلمية. وهي عينة من اللغة وليست اللغة كلهاء وبحسب وضوح المنهج 
التبم وانضباطه 2 جمع المدونات يمكن الاعتماد والوثوق بنتائج الدراسات 
القائمة عليها؛ فالهدف من استخدام المدونات ب2 دراسة اللفة هو الكشف عن 
الأنماط الشائعة 2 اللغة المستخدمة الذي قد يتطابق أو يختلف عما نعرفه عنها 


۱۷ 


قند ۱ انار وق 
اخد!ا: من الرکز 
و aas‏ بنشرضا ور Led‏ 
او تداو لها تحار پا 


وقد شرح هذا المبحث بشکل مختصر ومیسط خطوات إجرائية: تصلح إطارا 
lale‏ كن انباعه ale‏ تصمیم الدونات وبنائها: والآدوات الهمة الرثيسية 
لعالجة هذه الدونات. حيث وضح القسم الثاني من هذا الفصل آهم ما يجب 
النظر إليه عند تصمیم الدونات مثل لغة الدونة. وطبیعة نصوصها. وتاریخ هذه 
النصوص. ومکان صدورها. والاوعية التي ظهرت فيهاء والجالات الختلفة التي 
تفطيهاء كما ذکرنا 2 هذا القسم النقاط التي uel‏ بے تحدید حجم الدونة 
وحجم العینات التي تؤخذ للوصول للحجم الطلوب مع الاشارة إلى العاییر 
الآخرى التي قد یکون الباحث بحاجة لأخذها بالحسبان. كما تطرق القسم 
c‏ إلى مقهومین مهمین 2 الدونات يد دان آهمیتهاء هما التمثیل والتوازن. 

وتطرق القسم الثالث من هذا البحث إلى النقاط التي ينبفي الاهتمام بها 
عند تمع ERE agant‏ اير ااك اة د adii‏ 
الثاني. فتناول حقوق اللكية الفكرية. وتحدید مصادر جمع النصوصء وكيفية 
جمع النصوص مع التطرق إلى بعض 1 سائل التقنية عند الانتهاء من الجمع وهي 
ترمیز ملفات نصوص الدونة وتسمیتها وحفظها واضافة معلومات مساعدة 2 
E 3‏ ين gall‏ فون ان نیما بسا Asa E‏ 

وتطرق القسم الرابع باختصار إلى أهم الآدوات التي تساعد ب4 تحليل 
المدونات ودراستهاء فتطرق إلى خمس وظائف يمكن أن تساعد بشكل أساسي 
4 هذا الشأن هي الإحصاءات العامة عن المدونة بمجملهاء وقوائم التکرار, 
والكلمات المميزة للمدونات: والكشاف السياقي: والتصاحب اللفظي» ثم تطرق 
القع san Lad‏ إلى تال adt oot‏ شه 

ومع أهمية اتباع هذه الخطوات والإجراءات لجمع عينة من اللغة تكون ممثلة 
للغة أو إحدى صورها مجال الدراسة فإن الجهد يجب ألا يتوقف عند هذا الحد؛ 
فتصميم المدونة ونصوصها يجب أن يخضعا للمراجعة والتقويم المستمر متى 
ما استدعی الأمر ذلك؛ مع |تاحتها للباحشین ا خرن متی ما کان ذلك ممکنا. 


۱۷۵ 


Wi‏ المدونات اللفوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه الطبعة 
اخداء من المركر 
و لایسمع بنشرها Leä jg‏ 
او نداو لها تحار پا 
ms‏ 


الحواشي 
http://www.sketchengine.co.uk/ (V)‏ 
(A)‏ المد الذي يضاف 3 وسط الكلمة بغرض تصفيف الكلمة ومحاذاتها 
http://www.info.gov.sa/copyrights/SectionDetails.aspx?id=6 (A)‏ 
http://bootcat.sslmit.unibo.it/ )۱۰(‏ 
http://www.tei-c.org/index.xml )۱۱(‏ 
http://www.xces.org/( Y)‏ 
http://www.antlab.sci.waseda.ac.jp/software.html )۱۳(‏ 
http://sourceforge.net/projects/ghawwasv4 )۱۶(‏ 
SNP M:Saudi NewsPapers Males (۱°)‏ الصحف السعودية _ 
الذكور 
SNP F: Saudi NewsPapers Females (۱1)‏ الصحف السعودية _ 
الإناث 
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۱۷۸ 


قند aiiai‏ 
اهداء من jS A‏ 
و لا یسم بنشرغا ورقيا 
او تداو لیا تسا با 
î‏ 


المبحث الرابع 


لسانیات المدونات: 
نماذج وتطبيقات في لغة الصحافة العربية 


عقيل بن حامد الشمري و عبدالمحسن بن عبيد الثبيتي 


aalthubaity € kacst.edu.sa alaqeeel €? ksu.edu.sa 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


| daiat] asia 
إخداء من المركر‎ 
Led pg ولايسمح بنشرها‎ 


أو تداولها تجار Wi‏ المدونات اللغوية العربية | 


تا ne‏ بناؤها وطرائق الإفادة منها 


الهدف الأساسي لهذا البحث هو تقدیم نماذج تطبيقية, وعینات توضح طرق 
استخدام «لسانیات الدونات». وسبل استثمار امکاناتها الحاسوبية 2 رصد 
وتحلیل الظواهر اللفوية. وآما المادة اللغوية الستخدمة 2 التحلیل فهي «العربية 
الفصحی العاصرة» الستخدمة 2 لفة الصحافة الكتوية 4 كافة الأقطار 
العربية. ولقد اخترنا هذا الوضوع لربط لسانیات الدونات کمنهجية 2 الدراسة 
والتحلیل بالاشکال النظري التعلق ببعض ظواهر العربية العاصرة لكي یتسنی 
Ud‏ مناقشة ما یتعلق بذلك من قضایا ومسائل مع التمثیل الناسب العتمد على 
«لسانیات الدونات». وینقسم البحث إلى آربعة آقسام رئيسية. فبعد أن نتناول 
مفهوم «الفصحی العاصرة» وما یتعلق به من إشكالات نظرية ومنهجية + القسم 
الأول سننتقل 2 القسم الثاني إلى وصف الدونة وأداة التحلیل الستخدمة 2 
الدراسة الحالية. آما القسم الثالث فیستعرض al‏ النتائج الستخلصة التي 
توضح طرق استخدام الدونات 2 التحلیل اللفوي. والقسم الرابع یتضمن 
مناقشة عامة وموجزة تربط النتائج الستخلصة بالاطار النظري. وتوضح 
الاضافة النهجية التي تقدمها لسانیات الدونات. وما تفتحه من آفاق جديدة 2 
مجال البحث اللغوي. 


الإطار النظري 
١.4‏ الفصحی العاصرة بين الرفض وا لقبول وضعف البحث العلمي 


اللفة العربية ذات امتداد تاريخي طویل, وانتشار جفرا 2 واسع. وقد مرت 
بمراحل متعددة ومختلفة (انظر مثلا: فریمان. ۲۰۱۲). ومن ضمنها مرحلة 
العصر الحدیث. حيث شهدت اللغة العربية منذ مطلع القرن التاسع عشر 
اليلادي تفیرات واسعة. بسبب تأثیرات حركة «النهضة العربية الحديثة» (۰)۱۸ 


۱۸۱ 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


بعد فترة طويلة من الضعف والرکود عرفت 2 تاريخ آداب العربية ب«عصور 
الانحطاط والتدهور» (للمزید حول هذا الوضوع. انظر: بیلکین. ۱۹۷۳؛ فرستیغ. 
۳ وقد درج كثير من الباحتین والدارسین. سواء من العرب (مثل: بدوي. 
۲ عبد العزیز. ۱۹۹۸؛ الحمزاوي. (IAAT‏ أو من غیرهم (مثل: فرستيغ, 
Ryding :۲۰۰۳ .Bateson ۳‏ ۰۲۲۰۰۵ على اعتبار العربية الفصحی 
ا ك ds sa‏ مى gai‏ مسر تون بوقعی 
المعاصرة» .4 مقابل «فصحی التراث» من ناحية. والعاميات أو اللهجات المنطوقة 
والدارجة 2 المجتمعات العربية من ناحية آخری. 

ومع أن «الفصحى المعاصرة» عند أصحاب هذا الاتجاه امتداد للعربية 
2 کل عصورها وأزمانهاء إلا أن لها طابعها الخاص الذي يشتمل على بعض 
الظواهر والسمات المميزة(15١).‏ وهذه الظواهر متنوعة ومتداخلة, ولكنها تعود 
2 معظمها إلى ثلاثة جوانب أساسية: 

أ- جوانب تركيبية: تتعلق بنوعية الجمل المستخدمة (خلف. ,)5١١١‏ 
واستحداث تراكيب جديدة غير معهودة 2 العربية ( عبد العزیز. ۱۹۹۸؛ 
الزعبي. (Ys‏ بالاضافة إلى بعض الاختلافات 2 تعدية الأفعال 
واستخدام حروف الجر (السامرائي. ۱۹۹۵؛ حمادي, ۱۹۹۹؛ «gol adl‏ 
۷۲ نصار وحمادء o YE‏ والترخص أو المرونة 4 بعض القضايا 
المتعلقة بالمطابقة والرتبة (عبدالعزیز. ۱۹۹۹). 

ب - جوانب معجمية: تتعلق بتوليد واشتقاق أبنية وصيغ جديدة ( ستتكفيتش, 

6 ؛؛ القضماني وعبد القادر. £ * (Y^‏ وظهور تعابير مستحدثة (فاید . 
۲۳ بالإضافة إلى غلبة المفردات الحديثة. ذات الارتباط بالحياة 
الاجتماعية العاصرة. والتي استحدثت اما عن طريق الاقتراض. 
أو التولید. أو العدول عن الدلالات القديمة إلى دلالات آخری جديدة 
(ستتکفیتش. ۱۹۸۵). 


1۸۲ 


فده dais‏ 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداولهيا تسا با 


ج - جوانب أسلوبية: تتعلق بالترسل. والميل نحو الوضوح والسهولة. والتخلص 
من المحسنات البديعية (البعلبكي. e (VAMA‏ واستحداث أساليب جديدة 
متأثرة بالترجمة (ستتكفيتش» 1۱۹۸۵ عصفور. ۲۰۰۷ أبو الهيجاءء 
.٠0٠‏ بالإضافة إلى تطور آجناس الكتابة النثرية وموضوعاتها 
FEED TRE‏ 


وأغلب الدراسات التي تطرقت إلى الظواهر المتعلقة بهذا الموضوع تعتمد 
E‏ علی جهود مجمع اللفة العربية نظ القاهرة وقزار LI. an‏ والاأسالیب 
الستجدة (انظر مثلا: مجمع اللفة العربية, ۱۹۸۳؛ ۱۹۸۹). 


ورغم كثرة ما کتب 2 هذا الوضوع. الا أن مفهوم «الفصحی العاصرة, لا یزال 
lagga‏ منیا > يعاني الکثیر من الاضطراب النهجي والاصطلاحي (للوقوف 
على بعض الاشکالات الاصطلاحية حول مفهوم «الفصحی العاصرة». انظر: 
عبدالکريم. ۲۰۰۸). فرغم آهمية الاشارات واللا حظات التعلقة بالجوانب التي 
طالها شيء من التفیر والاختلاف 2 الفصحی 2 العصر الحدیث. الا أن تلك 
اللاحظات لا تزال ملاحظات جزئية. ذات طبيعة مجملة. فنوعية التغیرات 
فيما يسمى ب«الفصحى العاصرة». وحجمها. ومدی آثرها. وطبيعة مخالفتها 
لأساليب العربية ومستوياتها السابقة کل ذلك لم يدرس دراسة وافيةء ولم یفهم 
الفهم الکا 3 بعد (بشرء ۰۱۹۹۹ خلف» ۲۰۱۱). 


وك رأينا أن آسباب القصور ب تناول هذا الموضوع تعود إلى جانبین. 
أحدهما نظريء والآخر منهجي. a‏ لقصور الجانب النظريء فان كثيرا 

من الأحكام 2 هذا الصدد لا تستند إلى نظرية واضحة. وشاملة. وموحدة 
2 تحديد المستويات اللغوية. وما يميز كل مستوى عن الآخر. وما كتب 2 هذا 
الوضوع ( انظر مثلا: بدوي» ۰۲۰۱۲ السوسوة. ۲۰۰۲) لا يعدو أن يكون محاولات 
آولية غير مکتملة. خاصة 2 ظل الواقع العقد للسانیات الاجتماعية العربية الذي 
یشتمل على العدید من الظواهر وا لستویات التد اخلة ( انظر مثلا: Bassiouney‏ . 


۱۸۳ 


Wi‏ المدونات اللغوية العربية 


0 — بناؤها وطرائق البفادة (gio‏ 


هذه الطيعة 
إخداء من الرکز 
ولايسمع بنشرها Led pg‏ 
او تداولها تسار با 
بود 


4. ولذا فان مفهوم االفصحی العاصرة. رغم أنه قد يكون له مدلولات 
صحيحة. الا أنه لا يزال من الناحية النظرية مفهوما غير مکتمل. خاصة أن 
مجمل مراحل التطور التاريخي للعربية لا تزال غير مفهومة بشكل كاف ( انظر 
مثلا: فریمان. ۲۰۱۲). 


Ll;‏ بالنسبة لقصور الجانب النهجي. فرغم وجود عدد من الحاولات 
الجادة والجيدة لتتبع الظواهر والخصائص الستجدة 2 العربية العاصرة 
(مثل: ستتکیفتش, ۰)۱۹۸۵ الا أن کثیرا مما يكتب -2 هذا الوضوع لا پستند 
إلى منهج واضح(۲۰). فأغلب ما يكتب 2 هذا الوضوع عبارة عن ملاحظات 
مبنية على شواهد وآمثلة جزئية ومحدودة (انظر مثلا: السامرائي, ۰۱۹۹۵ 
عبد العزیز» ۱۹۹۸) i‏ ولا یقوم على منهج اختباري واحصائي لظواهر الاستعمال 
الفعلي یقارن مستویات الاستخدام اللغوي. ویسمح بتراکم نتائج البحث ومقارنة 
الدراسات. 

Y 4‏ الأنواع اللغوية .2 «ا لفصحی العاصرة»: dd‏ اتصحاقة تلود ها 

إن جوانب القصور + مفهوم «الفصحی العاصرة» لا تقتصر على ما 
zo 4‏ 
ذكر اعلاه. بل تتعدى ذلك إلى اغفال التنوعات المتعلقة بمستويات ومجالات 
الاستخدام اللغوي المختلفة داخل العربية. فمفهوم «الفصحى المعاصرة» مفهوم 
واسع جداء وبسبب القصور النظري والمنهجي الذي ذكرناه آنفا فإنه لا يراعي 
اختلاف السجلات وضروب الاستخدام اللفوي(۰)۲۱ وما بينها من فروقات. 
isida‏ مفهوم الفصحى العاصرة فإنه يشمل لغة الصحافة والكتب والرسائل 
العلمية. والروايات والقصص الادبية, والمكاتبات الإدارية والرسمية. وغيرها. 
ویشمل آیضا آنماطا مختلفة من التعبیر کالنمط العلمي والنمط الادبي, والنمط 
الاعلامي. وغیرها. ولذا فإننا نعتقد أن البداية الصحيحة لدراسة «الفصحی 
العاصرة: لا تکون بدراسة الأمثلة والشواهد الجزئية. بل بالانطلاق من الأنواع 


۱۸۶ 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرضا Led pg‏ 
او تداولها تحار پا 


اللغوية المختلفة لتوضيح ما بينها من مشترکات. وما يختص به كل نوع من سمات 
وخصائص مميزة. 

ورغم كثرة الأنواع اللغوية وتعددهاء فان الصحافة المكتوبة تعتبر أحد آبرز 
مجالات الاستخدام اللغوي 2 المجتمعات المعاصرة. وبالنسبة للعربية. فان 
صعودها وانبعاثها 2 العصر الحديث ابتدأ أصلا بنشوء الصحافة الحديثة 
(بیلکین. ۰۱٩۷۳‏ التي ظلت الوعاء الأساسي الحامل للفصحى المعاصرة 2 
الجتمع. وآبرز عوامل توسيعها وانتشارها (انظر مثلا: کنون. ۱۹۸۳؛ عبد العزيز, 
۷ البعلبکي. ۱۹۸۸؛ الحمزاوي ۲۰۰۳). ومن میزات الصحافة آنها تحتوي 
على عدد متنوع من الوضوعات والجالات من تقافية وعلمية ودينية واجتماعية 
وغیرها. مما یجعلها تحتوي على آنماط متنوعة من التعبیر والاستخدام اللفوي. 

ومع ذلك لم تحظ الصحافة العربية بالدر اسة اللغوية التي تستحقها. فأغلب 
ما کتب ویکتب 2# هذا الوضوع يندرج ضمن ما یسمی ب»حركة التصحیح اللغوي» 
(حمادي» ۱۹۸۱) الذي یقوم على تتبع ما يرد 4 وسائل الاعلام من «آخطاء» 
وتصويبها (انظر مثلا: عمر. ۰۱۹۹۳ على ما يعتري ذلك من اضطراب 
2 معاییر التصحیح. واختلاف 2 آراء الصححین (الحمزاوي. ۲۰۰۲؛ 
السامرائي: ۲۰۰۰). ولا یوجد الا عدد محدود جد من الدراسات الف بدأت 
مؤخرا تستخدم الوصف والتحلیل 2 دراسة آنماط ومکونات وأساليب التعبیر 
اللغوي 2 الصحافة العربية (للاطلاع على بعض الامثلة. انظر: عبد العزیز. 
۸ سمبس: (Y * T‏ ورغم آهمية هذه الدراسات الوصفية والتحليلية الا آنها 
لا تزال 2 معظمها تستخدم الاسلوب التقليدي الذي یعتمد على الفرز اليدوي 
2 استخراج البیانات واستعراضها. وتصنیفها (للاطلاع على بعض النماذج. 
انظر: فضل, ۲۰۱۰) بعيداً عما آنجزته لسانیات الدونات من تقدم کبیر 3 
مناهج الاحصاء والدراسة والتحلیل. وهذه النقطة بالذات هي ما ستحاول 
الدراسة الحالية التعامل معه كما سنشرح 2 الجزء التالي. 


هما 


Wi‏ المدونات اللفوية العربية 


تا مده بناؤها وطرائق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
a‏ تداولها تسار با 
ب — 


الدراسة الحالية: لسانيات المدونات وإمكانات 
البحث المتاحة 

الهدف الأساسي لهذا الفصل هو استخدام لسانيات المدونات ومناهجها 2 
الدراسة والبحث اللغوي لحل بعض الإشكالات النظرية والمنهجية التي ذكرت 
ل القسم السابق. فلسانيات المدونات تمثل منهجية اختبارية/6170111221 بديلة 
-2 البحث اللغوي تتجاوز التتبع العشوائي لظواهر جزئية ومتفرقة إلى التحليل 
المنظم لأنماط وأشكال الاستخدام الفعلي للغة بالاعتماد على الإمكانات والادوات 
الحاسوبية 2 الجمع والإحصاء والتصنيف واسترجاع البيانات (العصيمي. 
۳ ) ولذا فإنها توفر آلية مناسبة ومفيدة لدراسة العربية 2 العصر الحديث 
وما تحتوي عليه من أنواع ونماذج مختلفة ومتنوعة. ورغم أن لسانيات المدونات 
بذاتها لا تمثل نظرية 2 اللغة(۲۲). ولذا فإنها لا تتعامل مع الإشكال النظري 
بشكل مباشرء إلا أنها تؤدي إلى استخلاص نتائج اختبارية موثوقة ومنظمة 
قابلة للتكرار والتراكم والمقارنة والتعمیم. وهو ما يساعد على بناء النظريات 
واختبارها وتهذيبها على المدى الطويل. 

ورغم أن مفهوم «الفصحى المعاصرة» وما يتعلق به من إشكالات وقضايا 
يتجاوز حدود الدراسة الحالية والمساحة التاحة. الا أن المقصود هو تقديم 
نماذج وأمثلة لاستخدام الدونات 2 البحث اللغوي المرتبط بهذا الموضوع. ولذا 
فإننا سنكتفي 2 الدراسة الحالية باستعراض بعض العينات الممثلة دون الدخول 
2 تفاصیل كثيرة ومتشعبة. مع توضیح ارتباطات النتائج الستخلصة بما آثاره 
الاطار النظري من قضایا حول «الفصحی العاصرة». فاستخدام الدونات 
يتيح آنواعا متعددة ومختلفة من التحلیل والدراسة(۰)۲۳ اما بالانطلاق من 
فرضیات وتصورات نظرية مسبقة لفحصها والتحقق منها. أو بالاعتماد 
على رصد واستکشاف الظواهر البارزة 2 البیانات بدون افتراضات مسبقة. 


كما 


قند ۱ سای وق 
إهداء من المركز 


ولايسمح Li pisia‏ ورقيا 


ار عو ا 0 
تا — بناؤها وطرائق الإفادة منها 


وللتمثيل على ما نرید» فإننا سنستخدم 2 الدراسة الحالية كلتا الطریفتین. 
لا سيما أن الدراسات السابقة التي استعرضنا بعضها 2 الجزء السابق توفر 
بعض المعطيات التي يمكن اعتبارها افتراضات أولية حول ظواهر الاستخدام 
2 «الفصحى المعاصرة». خاصة قرارات الجمع وجهوده 2 دراسة الألفاظ 
ce dL‏ سیب الحربية ( AR ord UT aea‏ وار ابا 
ستتکفیتش, ۱۹۸۵). 


بیانات الدراسة وأدوات التحلیل 

Vt‏ الدونه 

سوف نستخدم 2 دراستنا هذه الدونة اللغوية للصحف العربية لعام ۲۰۱۲ 
(الثبيتي وآخرون et al‏ لإأنةطناط1-آلى.. (Y: Y‏ وتغطي هذه الدونة اللغوية 
عينة من الکتابات الصحفية من تسعة عشر بلدا عربيا موزعة على ستة مجالات. 
ويزيد الحجم الاجمالي للمدونة اللغوية للصحف العربية alal‏ ۲۰۱۲ عن ۲,۱ 
ملیون كلمة(4؟) . ورغم صفر حجمها نسبیاً (انظر المبحث الثالث الجزء التعلق 
بحجم الدونات) . الا أن الدونة اللغوية للصحف العربية لعام ۲۰۱۲ كافية من 
وجهة نظرنا للوفاء بغرض دراستنا الذي آشرنا إليه آنفا حيث إنها تعتبر مدونة 
لغوية متوازنة وممثلة للفة الصحافة العربية لسببين رئيسيين. آولهما آنها ضمت 
نصوصاً من صحافة جمیع البلدان العربية بشکل متساو (Yo) Lax‏ وثانیهما 
أنها ضمت نصوصا من أغلب الموضوعات المشتركة 29 الصحق العربية بشكل 
ale‏ الجدول )0( يوضح توزيع الكلمات على البلاد العربية التي شملتها الدونة, 
كما يوضح الجدول (1) توزيع الكلمات على مجالات المدونة. 


YAN 


شنه ۱ سار وق 
اهداء من jS A‏ 


و لا یسمع بنشرها ور قیا 


او تداو لیا تجاریا 
s‏ 

اليلد عدد عدد اليلد عدد عدد 
النصوص الكلمات النصوص الكلمات 
المغرب ۱۷ EEA‏ الكويت na‏ ۵ ۱ 
البحرين Yi‏ ۱۳۹۰۵ مصر ۱۹۲ ۱۳۵ 
الامارات ۱۷۷ ۱۳۸۰۵۱ الیمن ۱۳ ۱۳۰/۱ 
الأردن ۲۰۸ ۱۳۳۳۹۶ الجزائر YYo‏ 1۲+ 
السودان ER‏ ۱۳۳۳۸ تونس ۱۳۸ 4۰7 
السعودية ۱1۹ ۱۳۷/۸ لبنان Yo‏ 7۷ 
العراق ۱5۸ 471 سوریا ۳۹ ۸۳۷۹ 
قطر \YuEYé M‏ موریتانیا ۳۳ 0۰۷۵۹ 
عمان ۱۳۹ |۷ Laud‏ ۳۱ ۱۲۱۹۰۹ 


فلسطین ۱۸۷ ۱۳۵۹۰۵۱۹۸ 
الجموع ۰ لك 
جدول )9( توزیع کلمات الدونة على البلدان العربية 


الجال عدد اللصوص عدد الکلمات 
ARA £M ERES‏ *£ 
السياسئ YASEW evé‏ 
الرياضي ovi‏ 1.40 
الديني ۳۰ ۵ ۱( 
الاقتصادي ۳ 14° 
العلوم والتقنية ivi‏ ۳۱۰۹ 
المجموع YAI‏ 0 


جدول (1) توزيع كلمات المدونة على المجالات 


A۸ 


شنه daiat]‏ 
إهداء من المركز 


ولا يسمح بنشرها ورقيا 


مت 8 المدونات اللفوية العربية 
تا ne‏ بناؤها وطراثق الإفادة منها 


؛ ,۲ أداة التحلیل 

اخترنا آداة معالجة الدونات العربية «غواص» الذي تم تطویره 2 مدينة الملك 
عبد العزیز للعلوم والتقنية من أجل إجراء عملیات البحث والقارنة بين آقسام 
الدونة اللغوية الستخدمة 2 الدراسة الحالية. ویتوفر 2 غواص العدید من 
الامکانات الساعدة 4 دراسة الدونات وبالاخص العربية منها. وسوف نتطرق 
لأهم الوظائف التي سوف تساعدنا 2 هذه الدراسة. وهنه الوظائف كما يلي: 

= معلومات عامة عن المدونة اللغوية تشمل عد د اللصوص: وعدد الکلمات 
الكلي (حجم المدونة) وعدد الكلمات يدون تكرار. 
التى وردت فيها الكلمات والمتواليات اللفظية. 

- الكشاف السياقي للكلمة أو المتواليات اللفظية مع إمكانية تغيير عدد 
الكلمات السابقة واللاحقة ما بين كلمة إلى خمس عشرة كلمة. 

- تحديد الكلمات المميزة للمدونة عند مقارنتها بمدونة أخرى باستخدام 
طرق إحصائية مختلفة. 


-إمكافية oss Leal‏ معد مسبها من اتکلمات آو الدؤاليات فلا a us‏ 


نتائج قوائم التکرار. 
= إمكانية حصر البحث m‏ قائمة معدة T»‏ من الکلمات آو التوالیات 
اللفظية. 


۱۸۹ 


هذه datati‏ 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
ب — 


- إمكانية حفظ نتائج جميع الوظائف السابقة للمدونة كاملة أو حسب توزيعها 
على الأقسام أو خت الملفات کب على حدة. 


نتائج الدراسة 

۵ الكلمات الشائعة والأكثر تکرارا 

eati‏ اللحضناق گرا اكات يذ اللدرتة الاق ipis‏ اكرات 
الكلمات الشائعة. وعدد مرات ورودهاء ونسبة تكرارها من آبرز وأهم العمليات 
الستخدمة د تحلیل الدونات. ویعرض الجدول رقم (V)‏ قائمة بالکلمات 321 
الاکقر رورا کا c (Y) Ll hat‏ وکما بطي فان مجو التگرار الم ليلد 
الکلمات att‏ یعادل تقریبا ری کلمات الدوثة وهي نسبة کبيرة جداء تدل علی 
آهمية هذه الکلمات. ومدی شیوعها وتکررها. وبالنظر إلى هذه الکلمات نجد أن 
الفالبية العظمی منها تلتمي الی هة «الکلمات cdd dg!‏ وهي 2 مغلقة تشتمل 
على «الأدوات» أو «حروف العاني»(۲۷). وما یشابهها مثل الضمائر. وأسماء 
الاشارة والأسماء الوصولة. 


7 الكلمة 0 
Da 2. E‏ على أن cel‏ التي عن ما الذي Y‏ 71,۸0 
۲۰ مع هذا الله أو هذه ان و بين كان الى 4Y,M‏ 
us‏ كل ذلك بعد كما خلال لم هو إن حیث عليه 725,١١‏ 
0 و2 ولا وهو قد حتى قبل ومن له العام كانت RET‏ 
ish 0‏ قال بن أنه غير آي إلا يعض على فيها ‏ ۸۱,۲۲ 
1 وقد محمد وقال بها به ثم عام العالم فيه الذين *Y‏ : 


۹ دون عند ولكن عيد الناس العمل فقد تم | Xt ob‏ 
۰ عليها الرئيس تکون خاصة حول آخری مليون ‏ وما عدد LÍ‏ ۸۰,3۸ 
مجموع التکرار النسبي M‏ ا 


الجدول (v)‏ الکلمات المئة الأكثر تكراراً .2 المدونة 


asia‏ ار وق 
إخداء من الرکز 
ولايسمع بنشرها Led pg‏ 
او تداولها تحار پا 


ورغم أن القائمة تضم عددا من الأسماءء إلا أن أغلبها ينتمي إلى فة 
«الأسماء البهمة». مثل «بين» US‏ بعد. خلال. حيث» قبل» غیر. بعض, مثل؛ دون 
عند. حول». والأسماء البهمة. وان كانت من قبیل کلمات الحتوی. الا آنها قريبة 
من الکلمات الوظيفية وتشابهها 2 کثیر من سماتها وخصائصها(۲۸). مثل 
الدلالة على معنی وظيفي کالظرفية. وعدم التصرف والاحتیاج إلى الاضافة 
أو ما یشبهها 2 تتمیم معناها وتعیین مقصودها. وآما الاسماء العينة فقليلة, 
وکذلك الأفعال. وهي أقل آنواع الکلمات 2 القائمة. فلم يرد فیها الا ثلاثة أفعال 
فقط: «JI‏ یمکن. تم». 

ولا يقتصر الفرق بين الکلمات الوظيفية وکلمات الحتوی على كثرة التکرار 2 
الاولی وقلته 2 الثانية. بل يوجد بینهما فرق آخر من ناحية نسبة عدد اللصوص 
التي یتکرران فیها. فالتکرار اللسبي للنصوص التي وردت فیها کلمات الحتوی 
آقل بکثیر من تکرار اللصوص التي وردت فیها الآدوات والکلمات الوظيفية. كما 
توضح الأمثلة -2 الجدول (A)‏ 


الکلمة تکرار الکلمة تکرار اللصوص 
التکرار نسبة التکرار التکرار نسبة التکرار 
AAY all‏ ۳۷ ۹۳۷ ۳۱,۵ 
أو VAVY‏ ار 14 1۰,۷۹ 
هى YAYA‏ ۲ ۱۳۳۱ ,£0 
قال YA*0‏ 23 410 ۳,۹ 
Y- AY E sa ۲۷۹3 Bu‏ 
أنه £0,4V ۱۳۳۸ QM YVVY‏ 


لها 2 التكرار 


RENEE 
تا — بناؤها وطرائق الإفادة منها‎ 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


وكما يظهر 2 الجدول (A)‏ فان لفظ الجلالة (الله)ء على سبيل المثالء 
هو آکثر الأْسماء تکرارا ذ الدونة. ولکن مقارنته lal,‏ المطف (gl)‏ القارية له 
2 عدد مرات التکرار تبين أن نسبة تکرار اللصوص التي وردت فیها (Sl)‏ أكثر 
بکثیر من نسبة النصوص التي ورد فیها لفظ الجلالة. وینطبق الآمر نفسه على 
بقية کلمات الحتوی مثل JB)‏ بن) مقارنة مع الکلمات الوظيفية القاربة لها 
مخ کرات اتگران 

ولو رجعنا إلى الجدول (V)‏ فسنجد أن حروف الجر بالذات» سواء كانت 
مفردة 20 (YA Jia‏ علی. عن..». أو متصلة بضمير «عليهء لهء فيهاء بها..». 
هي الأكثر تكراراً من بين بقية الأدوات(۳۰). وهذا التکرار العالي قد يعود إلى 
سببين» أحدهما تركيبيء والآخر وظيفي. آما التركيبي فهو أن حروف الجر من 
«al‏ وسائل تعدية الأفعال. كما أن شبه الجملة المتكون من الجار والمجرور من 
أكثر أساليب الاتساع 2 بناء الجملة استخداما. وأما الوظيفي فهو أن حروف 
الجر أساسية 2 آداء كثير من المعاني الوظيفية 2 اللغة. ومن بين حروف الجرء 
نجد أن حرف )2( بالذات هو أكثرها تكراراً. وقد یمود ذلك أيضا لسببين. 
آولها أن ).2( أساسية به آداء معنی الظرفية. وهو من jid‏ العاني تکررا د 
اللغة. كما يدل عليه تکرار عدد کبیر من الظروف + الجدول (۳۱()۷). والتاني 
ربما یمود إلى قوة )2( وتمکنها 4 الدلالة على كثير من العاني والتبادل مع 
الحروف الأخری. وهذه من المسائل التي تحتاج إلى مزید من البحث والدراسة. 

ومما يلفت الانتباه 2 الجدول آیضا أنه يحتوي على مصدرین اثنین فقط. 
هما «أيضاء خاصة». وكثرة تکرار هاتبن الکلمتین عائدة إلى كثرة استخدامهما 
كأداتي ربط مما يجعلهما يقتربان كثيرا من الكلمات الوظيفية. وتحتوي القائمة 
كذلك على كلمة واحدة معربة. هي كلمة (مليون). وهي من أسماء الأعداد 
التي اقترضتها العربية ‏ العصر الحدیث. وأصبحت تستخدم بكثرة لعدم 
وجود كلمة بديلة 2 معناها. كما أصبحت تتصرف وفق النظام العربي, فتعرب 


| aala هيد‎ 


اخداء من المركر 0 
ولايسمح بنشرضا ورقيا s‏ 8 
أو تداو لیا تسار با 6 المدونات اللغوية &ujell‏ 
2 — بناو‌ها وطرائق الإفادة منها 


حسب موقعها 2 الجملة وتثنى (ملیونان/ملیونین) . وتجمع جمع تکسیر على 
(ملایین) ؛ رغم آنها لا تجمع لأنها من قبیل غير العدود بج لفتها الأصلية. 
وكذلك تحتوي القائمة على عدد من الظواهر والأسالیب الرتبطة ب«الفصحی 
العاصرة» نتيجة للتأثر بالترجمة. فعلی سبیل الثال. يرد ضمن القائمة تعبیر 
uaa fes‏ من اقغاي اة الس یکت ida]‏ اعا بدلا de‏ نهان 
2 التركيب المعاصر. ويلفت الانتباه كذلك كثرة استخدام الفعل «تم». وكثرة 
استخدام هذا الفعل بالذات تعود إلى الاستعاضة به عن المبني للمجهول(۰)۲۲ 
كما يوضح الجدول .)٩(‏ واستخدام الظرف (حول). كما يوضح الجدول (۰)۱۰ 
متأثر آیضا بأسالیب الت رجمة المستحدثة OY‏ ( حول) هنا ترجمة لکلمة (about)‏ . 
وکذلك الظرف (خلال) یکثر استخدامه 2 التعبیر الحدیث (من خلال) . ولذا 
فان (من) وردت قبل (خلال) ۱۹۳۹مرة. كما یوضح الجدول (V)‏ 
العوضي طبيعة الصورة المفبركة والتي ‏ د التلاعب فیها وتاریخها منذ عام 
أن نشهد ob‏ هناك کاتبا ‏ 5 ترهیبه لجرد کتابة قارب فیها 
تحدد القراءة عند عنوان جمالي 3 فهمه بشکل يرضي غرور ذلك 
الذهب فیها ومن جانب ثالث 3 إدخال ورقة القیقب 2 کندا 
مختلفا سنویا حتی عام Ote‏ تم تجمید التصمیم ولکن بعد طلب 
ومنها المسكوكة الفضية التذكارية التي تم اصدارها لتحمل ذکری مناسبة مرور 
آول التاحف 2 الخلیج وقد 5 افتتاحه -2 عام حيث یعرض 
البحرین والی جانب قاعاتها التخصصية تم اضافة الرکز الاقليمي نلتراث العالي 


الرممة وصل عددها إلى بیتا. 3 حمایتها من معول الهدم والسعي 


على التقدير الذي يستحقونه وقد 5 اختیاره ضمن عشرة آفلام للتنافس 


۱۹۳ 


شنه العظيعة 


إضداء من المركز 


ولايسمح بنشرها ورقيا 


او تداو لیا تسا با 
î‏ 


محور الكتابة المسرحية الجديدة المضامين 


آذر العوامل الاقتصادية والاجتماعية 
والسياسية 


الكيفية التي بدأ بها الكلام 
ملابسات مقتل الطفلة وديمة من 
البنية السردية الروائية ونقاط التحول 


الموضوع فالصفحات 2 معظمها اقتياسات 


الأدب والنقد الأدبى والأسرة والمرأة 


اللغة الكردية آنموذ جا لمؤلفه آزاد 
تراث وفكر مختلف الثقافات العالمية 
مجلة ما هو -2 نتاجها 


المسرح العربي متخلف عن نتاجات 


ايضا تقديم أربع أوراق عمل 


خصص جزؤها الأول لحديث نظري 


سنة ولا يوجد دليل واحد 

أن بدأت بعض المعلومات ترد 

فصول بالعناوين التالية إضاءات عامة 
خاليا من رؤية الباحث الشخصية 
الدورة الثانية عشرة دار الحديث 
کائن حي رؤية ونظرة فكرية 

4 عملية اقتناص بعض المعرفة 
شعرية معينة التفاف الحركة الشعرية 


المسرحي العربي الخطاب الذي يطرح 


الجدول (۱۰) عينة من الكشاف السياقي لاستخدام كلمة (حول) 


ترتيب الكلمات السابقة قبل (خلال) حسب 


عدد مرات ورودها 


الكلمة العدد 
من ۱۹۳۹ 
ومن 35 
دولار £A‏ 
ذلك YY‏ 
جنیه ۱۹ 
فمن Ww‏ 


ترتيب الكلمات اللاحقة بعد (من) حسب عدد 


مرات ورودها 


YAN هذا‎ 


الجدول (۱۱) تصاحب (من) و(خلال) -2 المدونة 


| FEWUCLLIEME 


اخداء من E 5$ AI‏ 
والايسمح بنشرضا ورقيا s‏ 8 
أو تداولها تجاريا 6 المدونات اللغوية العربية 
mm‏ بناؤها وطرائق الإفادة منها 


۵ ب. الكلمات الأكثر تکرارا 2 النصوص المتخصصة 

كما رآینا 2 الجزء السابق, فانه على الرغم من ورود عدد من کلمات المحتوى 
ضمن قائمة الکلمات الأكثر تکرارا الا أن التکرار النسبي لللصوص التي وردت 
فیها قلیل مقارنة بالکلمات الوظيفية. وهذا يعني أن کلمات الحتوی مرتبطة 
بنوعية معينة من النصوص تکثر فیها أكثر من غیرها. ولذا لا يكفي الکشف عن 
الکلمات الأكثر تکرارا بشکل cele‏ بل لا بد من الکشف عن الکلمات التکررة بذ 


الجالات المتخصصة داخل الدونة. لمعرفة ما پرتبط ویکتر 2 تلك الجالات من 
کلمات. وتعرض الجداول (۰)۱۲ (v) (3) ۰)۱۵( ۰)۱۶( OY)‏ الکلمات 
الشائعة 2 اللصوص المتخصصة 2 الجالات الستة التي وزعت علیها نصوص 
الدونة. 

J الكلمة‎ # 

١‏ .2 من على أن cii‏ التي عن ما الذي لا ۷ لز 

7۸۳,۲۵ هذا أو هذه مع و كان بين كل كما هو‎ ٣ 

2١,554 ذلك لم ان العربية الى بعد حيث هي العربي خلال‎ ٣ 

3 25 كانت الثقافة ‏ بن محمد ولا وهو خش إن فيها  2١,08‏ 

0 له FI‏ قد ومن عام ثم علي وهی فيه بها Ny‏ 

Zi io  ملاعلا إلا الثقل  عبد وقد أنه بعض التثقافية  به الكتاب‎ ٦ 

۷ غير الغة عليه بل تلك قبل الشاعر اليوم لها يكون ‏ ۱,۰۱ 

^ منها أي يمكن الذين ‏ لكن 5 أكثر xn‏ الحياة العام 7۸۰,۸۸ 

۸۰,۷۹ hes Lal آما الشعر  دون فقد‎ ye هناك العمل وما‎ ٩٠ 


۰ حول المجتمع علیها ob‏ يقول أخرى السرح كتاب الشيخ ‏ قال ۸۰,۷۱ 
مجموع التكرار النسبي ALE‏ 


الجدول (MY)‏ الكلمات الأكثر تكراراً 2 النصوص الثقافية 


۱۹۵ 


قند العظيعة 


إهداء من المركز 


ولايسمح Li asia‏ ورقيا 


al‏ تداولها تساريا 


m——— — 5 1‏ 
الكلمة 
يغ من على أن الذي التي إلى 
و ان النتخب ما الى هذا الفريق 
لم هذه حيث کل قبل البطولة خلال 
الاتحاد ود الأول بن أمام بين اليوم 
كما أو محمد كرة کاس وهو هو 
الكرة كانت العالم لگن KA‏ رفس له 
نقطة لكرة الشوط الدور الثانية العام e‏ 
قد المدرب ولا الأول عبد المجموعة اللاعب 
فى وكان أنه JU,‏ اللقاء ومن الدوري 
نادي عندما الدقيقة المشاركة  les‏ لاعب فيما 


مجموع التكرار النسبي 


الجدول (۱۳) الكلمات الأكثر تکرارا ‏ النصوص الرياضية 


ج من على أن 
هذا هذه الى الذي 
0 كما js‏ دولار 
بعد عام الحكومة ‏ غير 
نحو لم للاضي و2 
الاقتصادي الدول ‏ عدد أنه 


جديدة المائة زيادة کانت 


مجموع التكرار النسبي 


هو سعار 
رئيس الشركة 
حتى لدولة 
الوطني ‏ الخاص 
gus gy‏ 


الجدول (۱۶) الكلمات الأكثر تكراراً .2 النصوص الاقتصادية 


۱۹۹ 


قند ۱ سای وق 
إهداء من المركز 


و لا یسمع بنشرها ورقيا 


و تداو لها تجار © المدونات اللفوية العربية 
تا — بناؤها وطرائق الإفادة منها 
الكلمة J‏ 
2 من علی أن إلى التي عن ما لا الذى 2,۹ 
مع ان هذا هذه أو الی كان ذلك لم بين AY, Yo‏ 
الرئیس کل بعد إن هو كما النظام رئيس الشعب وقال AP‏ 


المجلس ‏ مصر السياسية حتى العام الدولة هى أنه هناك غير APPS‏ 
ولا سوريا على وهو العربية لكن له السورية الثورة المتحدة YY‏ 
حيث gan‏ السياسى منذ عليه العربي یمکن مرسي ومن الامن NN‏ 


الجيش الوطني اليوم فيها حول يكون الله تلك السلطة محمد PEE‏ 


تم السابق آکثر للانتخابات الآن ob‏ لها وقد فيه وأن ZAY‏ 
الذين قال m‏ بها دولة إلا فإن عام دون المعارضة ‏ 7۰,۸۷ 
مجموع التکرار النسبي 4Yo, AY‏ 


الجدول )10( الكلمات الأكثر تكراراً ب4 النصوص السياسية 


الكلمة / 
.2 من الله على أن لا إلى ما عليه عن ۳,۵ 
أو التي قال ولا هذا الذي صلى وسلم ذلك كان XY,‏ 
هذه إن ds‏ هو الناس له تعالى إلا بن بين ۸۲,۸۵ 
ومن به مع لم كما وهو qe‏ الإسلام فيه des‏ 21,1۷ 
ثم إذا و الذين فيها القرآن وقد أنه 25 بعد ZW‏ 
بها o ball‏ هي وما قد d‏ النبی الدين ‏ عنه بعض VARS‏ 
محمد يا ob‏ ابن الإنسان ‏ الى يقول يوم عند بل 11,۷ 
ان غير أي فقال الإسلامية وقال لهم فلا فقد الإسلامي ‏ ۸۱,۱۵ 


الصلاة الكريم ‏ لها رمضان وأن عبد کانت علي وهي حيث لولم 
الرسول لأن رضي الشيخ ولكن ol‏ منها أهل بما نفسه ۹۲ 
مجموع التكرار النسبي 24,14 


الجدول )١11(‏ الكلمات الأكثر تكراراً 2 النصوص الدينية 


۱۹۷ 


شنه ۱ سار وق 
إهداء من jS A‏ 


ولايسمح بنشرها ورقيا 


او تداوليا تجاريا 
î‏ 
# الكلمة / 
١‏ .2 من على أن m‏ التي عن أو ما هذه ۱۲,۵ 
هذا مع y‏ الذى و so JR os Ls‏ قد 1,۰۲ 


ZA فيها عملية‎ Li  لافطألا تناول إلا العلاج اللمعلومات  مما لها‎ M 
۸۰,۷ خاصة لکن المرض‎ cm ولتي طريق له ثم نسبة دون‎ ۰ 
مجموع التكرار النسبي الى ا‎ 


الجدول (Y)‏ الكلمات الأكثر تكراراً .2 النصوص العلمية 

آول ملاحظة تبدو للناظر 2 الجداول السابقة هي أن كلمات المحتوى 
بدأت تظهر بشکل آکبر ضمن قوائم الکلمات الأكثر تکرارا. وهذا متوقع. ففرز 
اللصوص وتوزیعها بحسب الجالات التي تنتمي الیها يوّدي إلى ظهور کلمات 
الحتوی التي تعبر عن تلك الوضوعات بشکل آکبر. ولکن يلاحظ آیضا أن آغلب 
كلمات المحتوى المتكررة من الأسماءء أما الأفعال فلا jos‏ ق Las‏ جم 
الجداول. وهذه الأسماء منها ما هو مشترك بين اثنين أو أكثر من الجداول 
السابقة. ومنها ما لم يرد إلا 2 جدول واحد. وسنترك حاليا الأسماء التي وردت 
متكررة ب2 أكثر من مجال, US‏ سنعلق على بعضها 2 LLS‏ الكلام لاحقا. وأما 
الأسماء التي لم ترد ضمن الكلمات الأكثر تكرارا إلا جدول واحد فقط. فهي 
كثيرة ومتنوعة. ويقدم الجدول (YA)‏ تلخيصا بتلك الأسماء مع توزيعها على 
المجالات التي وردت فيها. 


۱۹۸ 


Apa Loud التضوصضن‎ 


Bodl الختضوض‎ 


النصوص العلمية 


قند ۱ انار وق 
اخداء من المركر 
والايسمح بنشرغا ورقيا 
او تداو لیا تسا با 


الکلمات التي انقرد الجال بظهورها ضبن الأكثر تکرارا 


المجتمع, الحياة. التقافة. الثقالكء التقافية. الکتاب. کتاب. اللغة. 
الشاعر. الشعر . المسرح 


النتخب. منتخب. منتخینا. الفریق. فريقء الاتحاد. الباراة. 
الجموعة. البطولة. بطولة. اللاعبین. اللاعب. لاعب. القدم. 
الكرة؛ كرة:لكرة: كأسء الفوز: المركز: ALE‏ الشوظ:؛ الدون: 
الوسم. الدرب. الناديء ناديء الرياضية. اللقاء. الدوريء 
اللجنة. الدقيقة. الثانية. الشاركة 


الدول. دول. الماضيء العامة. دولار. «JU‏ دینار. ملیون. ملیار. 
آلف. all‏ شركة. الشركة. الشرکات. الالية. وزارق. القطاع. 
قطاع. بنسبة. الاقتصاد. الاقتصادية. الاقتصادي. السوق. 
أسعار» سعرء النفطء البنك» فترة: الخاص» مستوىء زيادة: 
الاستشمار. مقارنة 


الرئیس. دولة. المجلس» مصر ؛ النظام. الشعب. السياسة. 
السياسي. التحد (à.‏ السوري.: سوریا: السورية. الثورة, مرسي: 
الأمن. الجيشء السلطةء الانتخابات: ضدء المعارضة:؛ السایق 


ابن. الناس. الإنسان؛ الدين: الإسلام: السلمین. الاسلامي. 
رسول. الرسول, القرآن, النبي, الصلاة. رمضان. العلم. «Jal‏ 
deuas‏ الکریم 


الد کتور. TE‏ استخدام. الجسم. الطاقة. الدراسة. الصحية. 
الجهاز. الاصابة. العلاج. العلومات. الاأطفال. عملية. طریق. 
الرض 


الجدول (۱۸) الأسماء الأكثر تکرارا £ الجالات المختلفة 


۱۹۹ 


Wi‏ المدونات اللغوية العربية 


تا ne‏ بناؤها وطراثق الإفادة منها 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


وكما يظهر 2 الجدول السابق» يوجد نوعية معينة من الكلمات المتكررة 2 
كل مجال تعكس طبيعة الموضوعات المطروقة فيه. فيلاحظ -على سبيل المثال- 
ا تکرارا ها التصوسن EE‏ كاك dela‏ اترات اة 
والصحية. وللکلمات الأكثر تکرارا ب النصوص السياسية ارتباط کبیر بالأحداث 
الجارية. فکلمات (مصر. السوري. سورياء السورية. مرسي. السابق) ريما لم 
تتكرر الا بسبب طبيعة الأحداث التي تزامنت مع تاريخ نصوص الدونة. بخلاف 
الکلمات ف الجالات الأخرى التي یبدو أن لها ارتباطا آکثر دواما بالجالات التي 
ظهرت فیها. ومن الناحية الكمية. يلاحظ أن النصوص الرياضية والاقتصادية 
بالذات تحتوي علی عدد آکبر من الأسماء ضمن قائمة الکلمات s SIE‏ تکرارا. 
وربما یعود ذلك إلى أن هذين الجالین مجالان متخصصان لهما کلمات خاصة 
محصورة ومحدودة مما يجعلها 20883 4538 وسنجد ما يؤكد هذه اللقطة 
d‏ سبال اتراي یقن قاس با لحرو افاي اسان الات اة 


۵ ج. الکلمات الميزة للمجالات المختلفة 

لا تقتصر امکانیات البحث 2 الدونات على الکلمات الأكثر تكراراً ,2 الجالات 
الختلفة. بل یمکن آیضا استخراج الکلمات الميزة لكل مجال من الجالات على 
حدة. واستخراج الکلمات الميزة پتطلب أن يكون لدینا مدونتان. أحدهما هي 
الدونة التي نرید معرفة ما یمیزها من کلمات والأخرى هي الدونة الرجعية, 
وتحوي النصوص التي تستخدم للمقارنة مع نصوص الدونة التي نرید تمییزها. 
ویتم استخراج الکلمات الميزة عن طریق مقارنة التوزیع الا حصائي للکلمات 2 
المدونة التي نرید تمییزها بالکلمات 2 الدونة الرجعية. 

2.3 دراستنا الحالية قمنا باستخراج الکلمات الميزة عن طریق مقارنة کل 
مجال من الجالات الستة ببقية نصوص الدونة الكاملة التي تشمل الجالات 


شنه العظيعة | 


اخداء صن المركر 0 
و لا يسمح بنشرغا ورقيا -— 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 
mn‏ بناؤها وطرائق الإفادة منها 


الآخرى ما عدا المجال القصود. ومع أنه يوجد طرق إحصائية متعددة للمقارنة 
واستخراج الكلمات الميزة. الا آننا استخدمنا طريقة «معامل الغرابة» لأنها من 
آسهل الطرق وآوضحها. ومعامل الفرابة هو حاصل قسمة التکرار النسبي للكلمة 
2 الدونة التي نرید تمییزها ( الدونة أ) على التکرار النسبي للكلمة نفسها .2 
المدونة المرجعية (المدونة ب). وحاصل القسمة قد يكون: 
أ- (ما لا نهاية): إذا ظهرت الكلمة 2 المدونة )1( فقط ولم تظهر 2 
المدونة )=( 
فك أو ررض كرا octo Ve eas‏ اف ges (T) eg d‏ 
بكثير من تكرارها النسبي 2 المدونة (ب) 
ج - أو :)١(‏ إذا تساوى التكرار النسبي للكلمة 2 المدونتين 
د - أو (قرييا من الصفر): إذا كان التكرار النسبي للكلمة 4 المدونة (ب) 
أكبر بكثير من تكرارها النسبي 2 المدونة (1). 
ويتم اعتبار الكلمة من الكلمات المميزة عندما تكون قيمة معامل الغرابة 
(ما لا نهایة). أو أكبر من رقم معين يتم اختياره ووضعه كمقياس للمقارنة. و 
حالتنا فقد تم اختيار الرقم ٠١‏ كحد أدنى لقيمة معامل الغرابة المقبول للكلمات 
ESO‏ 
ولكن لا بد من ملاحظة أنه من الممكن أن تكون قيمة معامل الغرابة (مالا 
نهاية) حتى ولو لم تظهر الكلمة إلا لمرة واحدة فقط 2 المدونة (Í)‏ ولم تظهر .2 
المدونة (ب). ولتجنب ذلك لابد من وضع معيار آخر غير قيمة معامل الغرابة 
يتعلق بعدد مرات تكرار الكلمة من أجل إدراجها ضمن الكلمات المميزة. 2.5 
حالتنا فقد اخترنا الرقم (۶۰) ليكون الحد الأدنى لعدد مرات التكرار المطلوبة 
لتضمين الكلمة 2 قائمة الكلمات المميزة. 


شنه ۱ انار وق 
إهداء من المركز 


ولا يسمح Li pisia‏ ورقيا 


او تداو لیا تسا با 


وبناء على هذين العیارین فقد تم استخراج الکلمات المميزة + کل مجال على 
حدة. كما تم توزیع الکلمات الميزة على آربعة تدرجات أو مستویات. كما توضح 
الجداول (۱۹)ء (۰)۲۰ (۰)۲۱ (YE) (YF) (YY)‏ فالستوی الأول یشمل 
الکلمات التي قيمة معامل غرابتها هي La)‏ لا نهایة) , وقد کتبت ‏ الجداول 
بالخط الفامق. Lal g‏ الستوی الثاني فیشمل الکلمات التي معامل غرابتها آکبر من 
أو يساوي (0۰) ولیس ما لا نهاية. وکتبت بالخط المائل. والستوی الثالث یشمل 
التي معامل غرابتها آکبر من آويساوي (۱۰) lo‏ من (۵۰). کتبت وتحتها خط. 
وآما الستوی الأخیر. فیشمل الکلمات التي معامل غرابتها آقل من (۰)۱۰ وقد 
کتبت بدون تمييزء ولا تعد من قبیل الکلمات الميزة. لأنها لم تتجاوز الحد الأدنى 


القصيدة المساري التشكيلية 
الابداعی الوسيقي 
الروائي والشاعر 
الناقد التشكيلى 


ودان 

الان 

الفنون 

ala‏ الأديب 

فشرحية الابداعية 
والتراث ‏ والفنون oal‏ 

الفلسفة النقاد 

cll ags 

المختار ٠‏ الكتب 


i 
f 
t 


منافسات 
الزمالك 
ريكاردو 
البرازيلي 


للكتاب 
الشعراء 
اللغوية 
الخرج 
الترجمة 


مدرب 
الاتحادات 
بطولة 
اللقب 


اللاعبون 
منتخبات 
تمريرة 
بولندا 
الأولبي 
للكرة 
للمباراة 
فريقي 

ا ميداليات 
الودية 


السرحية 
للفنون 
قصائد 
شعراء 
المكتبة 
الحداثة 
التراث 
القارئ 
الجائزة 


لاعبو 
الرجوب 
اولمبياد 
ركنية 
الاندية 
ا مدربين 
رصيده 
ا مونديال 
الحارس 
تصفيات 


باللقب 


لكأس 


gua! 
قصيدة‎ 
الشاعر‎ 
مسرح‎ 
الفيلم‎ 
الإبداع‎ 
اللغوي‎ 
الموسيقية‎ 
ديوان‎ 
التدريس‎ 


الجدول (۲۰) الكلمات المميزة لنصوص المجال الرياضي # المدونة 


الكابتن 
ارسنال 
مباریات 


بفوزه 


قند daiat]‏ 
إهداء من المركز 


ولايسمح بنشرها ورقيا 


al‏ تداوليا تسار با 
,سيا 
التأهل للبطولة اللاعبون لاعبو 
تأهل بالتعادل منتخبات الرجوب 
سدد ركلة تمريرة ‏ اولبیاد 
لاعبينا ١‏ الترجي بولندا ركنية 
لاعبين ا مباراة 2 الأولبي 2 الاندية 
للمنتخب ‏ مهاجم للكرة ا مدربين 
منافسات — مدرب للمباراة 2 رصيده 
الزمالك الاتحادات ‏ فريقي ا مونديال 
ریکاردو بطولة ا ميداليات ‏ الحارس 
البرازيلي اللقب الودية تصفيات 


لكأس 


Wi‏ المدونات اللغوية العربية 


الجدول (۲۱) الکلمات الميزة لنصوص الجال الاقتصادي 2 الدونة 


اشتباکات 
Er‏ 


الأسد 


العدلي 
ا مدنيين 


قوات 


لحقوق 
الجرائم 


gala 
الإرهابية‎ 
كردفان‎ 
الإخوان‎ 
هادي‎ 


jis 
القوات‎ 
السورية‎ 
العسكري‎ 
البرلان‎ 


الخابرات 


الدستورية 


کلیفتون 
دارفور 
لاقتراع 
لانتقالية 
المحكمة 


الجدول (YY)‏ الكلمات المميزة لنصوص المجال السياسي 2 المدونة 


أخلاق 
لقلوب 


الرسل 
المشركين 
أخرجه 
عليم 


سيحانه 


رواه 
als Jl‏ 
الآخرة 
ورسوله 
يسم 
الإيمان 
لقوله 
alaa‏ 
خیرا 
صلاة 


الحرام 
السلم 


الذنوب 
ا مؤمنين 


ربك 


الجهاد 


الجدول (YY)‏ الكلمات المميزة لنصوص المجال الديني 2 المدونة 


Yoy 


بناؤها وطرائق الإفادة منها 


الدستوري 


alc‏ ار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداو لیا تسا با 


,سيا 

آندروید الغدة آبل الجراحة فيتامين الروبوتات الروبوت. الحواسیب ويندوز الجينات 
نوكيا الجينية الدرقية إنتل الأسبرین التأكسد الهضمي الجذعية غوغل الصداع 
جراحة opal‏ القولون 2 فيروس puba‏ هرمون السمنة أبل goal‏ الأورام 
العدسات السوائل 2 الاكتثئاب 2 الاصطناعي السرطانية العلاجات  dese‏ القلبية الكلوي الثدي 
التهاب مضاعفات فيسبوك الكالسيوم lieh‏ العالج اللوحية البرمجيات ‏ هاتف الألياف 
سرطان العدية الأشعة الكبد الكلى الهضم الشرايين ‏ مستخدم . استخدم الناعة 
الفیروس الباحثون رطان الآلام بمرض بأمراض الضادات — الفیروسات . الأدوية بيري 
البول للجسم البكتيريا ١‏ مایکروسوفت ‏ الخلايا الوراثية الهواتف ‏ الریض طب مرضى 
الأعراض التدخين ‏ الأسنان ‏ الکمبیوتر باحثون العصبي مستخدمي ‏ السرطان ‏ مریض الذكي 
الستخدمين آمراض المحمولة الحاسوب الدم الدموية أدوية الجسم الحرارية ‏ لعلاج 


الجدول (YE)‏ الكلمات المميزة لنصوص الجال العلمي 4 المدونة 

آول ملاحظة تبدو لنا هي أن توزيع الكلمات المميزة بالنسبة لمستويات معامل 
الغرابة مختلف بين الجالات. كما يلخص الجدول رقم (Yo)‏ وكما يبدو فإن 
آکثر الجالات تمیزا هو الجال الرياضي حیث تحتوي النصوص التي تنتمي إلى 
ها الجال علی عدد كزين تسبیا من الکلمات الخاصة )£1 کلمة) الق کم 353 
Lad‏ غ ان مداق کی كبا رن بشید bed‏ او oae‏ اقا نها مان 
غرابة کبیر نسبیا. وهذا يؤكد اللاحظة التي ذکرناها سابقاء فالجال الرياضي 
مجال مستقل بشکل واضح, له کلمات محصورة ومحددة تتکرر بشکل کبیر. 
وتمیزه إلى حد كبير عن غيره من الجالات الاخری. 


الدونة معامل الفرابة 
مالانهاية ‏ آکبرمن:ه. آکبرمن:۱ . آقل من ۱۰ 

01 YA 1 الثقافية‎ 

ov &Y الرياضية‎ 

oY í£Y 0 الاقتصادية‎ 

3 ۸۳ E Y السياسية‎ 

الدينية ۵ ۳۹ 01 

A VY JA العلمية‎ 


الجدول (Yo)‏ عدد الكلمات المميزة بالنسبة لمعامل الغرابة 2 المجالات المختلفة 


قند ۱ انار وق 
اخد!ا: من الرکز 
و aas‏ بنشرضا ور Led‏ 
او تداو لها تحار پا 


ويأتي بعد الجال الرياضي الجال العلمي. حيث تحتوي نصوص هذا الجال 
على (۱۸) كلمة مميزة لم ترد 2 أي مجال آخر. كما أن کثیرا من کلماته ذات 
معامل غرابة مرتفع نسبيا. ورغم أن ذلك يعني أن نصوص الجال العملي متميزة 
إلى حد ما من ناحية نوعية الكلمات الستخدمة. إلا أن تميزه لم يكن بالقدر 
المتوقع. ولعل السبب 2 ذلك يعود إلى أن نصوص المجال العلمي .2 الصحافة ذات 
صبغة عامةء موجهة إلى عموم القراء ‏ الجتمع. وليست نصوصاً متخصصة, 
موجهة إلى قراء متخصصين. 

ومن ناحية أخرىء فان المجال السياسي هو أقل المجالات تمیزا. فالكلمات 
المستخدمة ب4 هذا المجال مشتركة مع بقية المجالات إلى حد كبير. وكما رأينا 
سابقاء فان الکلمات الاکفر كرارا ف هذا الجال شرقطة غالبا بالأحدات 
الجارية. ولیس لها ارتباط دلالي دائم بالجال السياسي. وربما یمکن أن نستنتج 
من ذلك أن الجال السياسي 2 الصحافة العربية هو آکثر الجالات عمومية. 
وأقلها نضجا بسبب افتقاره إلى الکلمات الحددة والخاصة. وهذه من السائل 
التي تحتاج إلى مزيد من البحث والقارنة. 

ولو أردنا أن نقف على طبيعة الکلمات المميزة فسنجد أن أغلب الکلمات المميزة 
ك الجال Lil‏ 2 لها دلالات ترتبط بالفنون والأنواع الأدبية المختلفة مثل الشعر 
والرواية والمسرح والرسم التشكيلي والسينما والموسيقا. وهناك مواد معينة تكثر 
تصريفاتها واشتقاقاتها ضمن الكلمات المميزة للمجال الثقا (ثقفء أدب 
بدع. io‏ كتب) . وتحتوي الكلمات المميزة 2 هذا المجال على عدد من المعربات 
القديمة (دیوان. مهرجان. فلسفة. موسيقا) والحديثة (السینما. الدراماء 
الفیلم) . وأما المجال الرياضي فكثير من كلماته المميزة عبارة عن مصطلحات 
موضوعة حديثا لدلالات مخصوصة 2 هذا المجال ( الشوطء النتخبات. التأهل. 
البطولة. الرمی, رکلة. تمريرة. ركنية). وكذلك تحتوي كلماته المميزة على 


Wi‏ المدونات اللفوية العربية 


تا — بناؤها وطرائق الإفادة منها 


شنه الطبعة 
إضداء من S A!‏ 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسا با 
î‏ 


عدد من المعربات الحدیثة(۳۳) ذات الدلالات المحصورة (المونديالء الأولبیاد. 
الفيفاء ميداليةء برونزيةء الکابتن. الفیفا) . 


وآما المجال السياسي فنسبة كبيرة من كلماته المميزة عبارة عن آعلام. اما 
أسماء أشخاص أو دول أو أقاليم أو منسوبة إلى بعضها. ويوجد قليل من الكلمات 
المعربة 4 هذا المجال (الدستورء البرلان. الديمقراطي). وكذلك المجال 
الاقتصادي لا يوجد ضمن كلماته المميزة إلا عدد قليل من الكلمات المعربة ( بنك 
بورصة) وأغلبها من قبيل أسماء العدد والعملات والمقادير (ملیون. مليار, 
طن. برميل). بخلاف المجال العلمي الذي تطغى عليه بشكل واضح الكلمات 
المعربة والمقترضة. ورغم أن بعضها من قبيل الأعلام كأسماء الشركات والآلات 
(آندروید. مایکروسوفت. آبل, غوغل. فیسبوك. ویندوز) الا أن كثيراً منها 
مصطلحات معربة ( الروبوتات. الجینات. البرمجیات. الفیروسات. البکتیریا. 
السرطان. هرمون, التأکسد. الکالسیوم. القولون) . وکذلك یوجد عدد كبير من 
الصطلحات الوضوعة حدیثا ( الهواتف. الحواسیب. الأشعة؛ الألیاف. الخلاياء 
v cua‏ انس a C‏ كينا آن هددا من الكت اوو انان 
العلمي لها دلالات مرتبطة بالجسد وآعضاته ووظائفه ( الجسم. الفدة. القلبية, 
الکلی. الثدي» الکبد. الشرایین الاسنان. العصبيء الدم» الهضم. البول) . 

وکما یوضح الاستعراض السابق. فان الفالبية العظمی من الکلمات الميزة 
2 كافة الجالات من کلمات الحتوی التي تحمل غالبا دلالات حديثة. وآکثرها 
من الأسماءء وآما الأفعال فمحدودة جدا. وتحتوي الأسماء على عدد کبیر من 
الصادر والشتقات الولدة والستحدنة. فمنها أبنية مستخدمة اکتسبت دلالات 
جديدة مثل (جراحة. الرمی. (CARI‏ ولکن منها آیضا ما هو جدید 2 مبناه 
ومعناه مثل (سيولة. مسرح. محكمة. مهاجم. مخرج). فالصدر (سیولة) - 
على سبیل الثال - بناء مستحدث على وزن فعولة 2 هذه الادة. وکذلك اسم 


| aala هيد‎ 


اهداء من المركز z‏ 
ولايسمح بنشرضا ورقيا : : 
أو تدار لها تجار یا Wi‏ المدونات اللغوية العربية 
2 — بناو‌ها وطرائق الإفادة منها 


الفاعل (مهاجم) وفعله (هاجم) کلاهما بناء جدید مستحدث ومولد من مادة 
(aro)‏ وینطبق ذلك على اسم الکان (محکمة) 2 مادة (ح ك م). 

ورغم وجود نسبة كبيرة من الکلمات العربة والقترضة. الا أنه يلاحظ وجود 
حالات ALES‏ وردت فیها الکلمات الأجنبية ومقابلاتها العربية الولدة معا ضمن 
الکلمات الميزة. مثل (بنك/مصرف) ك الجال الاقتصادي. و([حاسوب/ 
کمبیوتر) 2 الجال العلمي. وکما یوضح الجدول (Y1)‏ فان كلمتي (حاسوب) 
و( کمبیوتر) تستخدمان بمقدار متساو تقريبا. آما كلمة (بنك) فتستخدم بشکل 
آکبر بکثیر من مقابلها العربي (مصرف). خاصة حینما تکون معرف بالالف 
واللام. وقد یکون ذلك عائدا إلى أن كلمة (البنك) تستخدم کجزء من آسماء 
البنوك. مثل (البنك الأهلي» البنك الوطني...). ولذا لم ینجح القابل العربي 
لهنه الفردة بسبب أن المؤسسات القصودة تسمي نفسها بالقابل الأجنبي. 


نوع الكلمة الصرف والبنك الحاسوب والکمپیوتر 
الكلمة العدد الكلمة ‏ العدد الكلمة العدد ‏ الكلمة ‏ العدد 
منکرة مصرف ٠١‏ بنك ۶ احاسوب ‏ 397 كمبيوتر YA‏ 
معرفة ‏ الصرف ۰ ٩۵‏ البنك ۹ الحاسوب ‏ 198 الکمبیوتر ‏ ۱۳۲ 
الجموع ۲۰۱ ۷۹۸ ۱۰1 vw‏ 


الجدول (YV)‏ تکرار كلمتي ( بنك وکمبیوتر) ومقابلیهما العربیین 2 الدونة 
۵ د. البحث 2 مادة معجمية : مادة (عمل) مثالا 


بخلاف ما سبق مما یعتمد على البحث 4# مجموع نصوص المدونة لاستکشاف 
واستخراج الکلمات الشائعة أو الميزة. فإن لسانیات الدونات یمکن أن تستخدم 
للبحث 4 قضية محددة سلفا كالبحث عن كلمة معينة, أو تعبیر محدد. أو مادة 
مقصودة. لاستكشاف تصريفاتها واشتقاقاتهاء ومواضع استخدامهاء وما 
يطراً عليها تبعا لذلك من اختلاف ي العاني أو طرق الاستخدام. وغالبا ما 


asia‏ انار وق 
إخداء من الرکز 
ولايسمع بنشرضا Led pg‏ 
او تداولها تحار پا 
بود 


يتم استخدام هذا النوع من البحث بناء على فرضيات معينة متعلقة بالكلمات 
والعبارات القصودة. فلو أخذنا مادة (Jag)‏ على سبيل الثال. فسنجد أن كلمة 
(العمل) قد وردت ضمن الکلمات الاکثر شیوعا 2 الدونة كاملة ) جدول (Y‏ و 
مجالین من الجالات الخاصة. وهما الجالان الثقا 2 والاقتصادي (الجدولان 
۲ و ۱۶). وقد ورد من مشتقات هذه الادة كلمة ) عملیة) ضمن الکلمات الأكثر 
شیوعا 2 الجال العلمي ( جدول ۱۷). وكلمة ( تعاملات) ضمن الکلمات الميزة 
للمجال الاقتصادي Yo dean)‏ 

ورغم أن مادة (ع م (J‏ مادة ثرية ومتشعبة ب4 المعجمات العربية؛ الا أنه قد 
استجد فيها العديد من الأبنية والدلالات(۳۶). فمن الأبنية المستحدثة 2 هذه 
المادة المصدر الصناعي (عملية). والصفة على وزن (فعیل) (عمیل) ؛ والمصدر 
على وزن (فعولة) (algae)‏ واسم المكان (معمل) . وبالرجوع إلى المدونة یمکننا 
استخراج هذه الکلمات وتکرارها ومواضع ورودها. ورغم أن متابعة التحلیل 
التفصيلي قد تؤدي إلى الکثیر من النتائج. إلا آننا سنكتفي هنا فقط باستعراض 
تکرار هذه الکلمات 2 الدونة كاملةء و2 الجالات الفرعية الختلفة. كما یوضح 
الجدول (V)‏ 


الكلمة تصریفاتها (Yo)‏ ريض قصد سيس دين علم كمل الجموع 


۱۹۷۸ AVF ۲۸۷ ۰ ۲۲۶ ۲۰۱ ۲ NÉ عملية عملية‎ 
۳۹۲ 4 Yv Wi ov Y. 10 العملية‎ 
:۳1 AV ۹ ۱۱۱ MAE ۱۳ ۳۲ عملیات‎ 
۱۷۹ ۰ ۹ oY ۳۳ ۷ M العمليات‎ 

YA M Y ١ ۲ ۳ . ١ عميل عميل‎ 
۳۱ ۱۲ 3 Yo العمیل‎ 
۱ ۷ ۲۲ ۱ عملاء‎ 


قند العظيعة | 


إهداء من المركز -= 
ولايسمح بنشرها Led pg‏ 
أو تداونيا تجاريا W‏ المدونات اللغوية العربية م 
00 — بناؤها وطرائق الإفادة منها 
العملاء AE Y: ۰ ۷ Ww . s‏ 
معمل معمل ۱ oY T Y ١ ١‏ 
العمل ۲ ۲ 0 ۹ 
معامل ۲ ۷ ۲ 1 ۱۸ 
العامل ۱ ۳ t ١ ١‏ ۱ 
عمولة عمولة . : ۲ ۱ ۲ ۲ ys Y‏ 
العمولة 
عمولات ۲ ۲ 
العمولات . 3 1 ۲ š‏ 1 
الجموع A EE Yi.‏ 0£0 ۱۷ 0۵۱ ۲۱۱۹ 


الجدول (YV)‏ الأبنية الجديدة 2 مادة (عمل) وورودها 2 الدونة 


وکما یلاحظ 3 الجدول السابق. فان كلمة (عملیة) هي الأكثر استخداما 
من بين الأبنية الجديدة 2 مادة (ع م ل) ۰ وبفارق کبیر جدا عن الأبنية الأخری. 
وكلمة (عملیة) من الکلمات المتأثرة بالترجمة فهي تستخدم 2 مقابل کلمتي 
(process)‏ و (operation)‏ . وریما تعود كثرة استخدامها إلى آنها ذات مدی 
دلالي واسع ولا تختص بمجال معین. وآما بقية الکلمات فمحدودة الاستخدام 
جدا. ف(عمولة) (۳۱)لم ترد الا 2 عشرة مواضع «da‏ ومحصورة 2 الجال 
الاقتصادي. وکذلك (عمیل) ذات ارتباط بالجال الاقتصادي للدلالة من یتعامل 
مع غيره 2 حرفة أو صنعة أو تجارة. وهي الأكثر استخداما 2 هذا العنی .2 
مقابل الكلمة التقليدية (حريف) و (زبون) وهي كلمة مولدة آخری كما یوضح 
الجدول (YA)‏ وآما (حریف) فرغم آنها الكلمة التراثية الستخدمة 2 معنی 
(عمیل) (YY)‏ الا آنها اندثرت تقریبا # الاستخدام العاصر الا -2 مواضع 
محدودة جدا ب2 الفرب العربي. فلم ترد ك الدونة بهذا العنی الا .2 ثلاثة 
مواضع فقط یعرضها الجدول (Y^)‏ 


هذه الطيعة 

إخداء من الرکز 

ولايسمح بنشرها ورقيا 
او نداولها تساريا 


جح ود 
الكلمة تصریفاتها التکرار الجموع 
عميل عمیل NA M‏ 
العمیل ۳۱ 
عملاء 3 
العملاء 5 
زبون زبون ۲ ۷۸ 
الزبون Ww‏ 
زبائن ۸ 
الزبائن 2 
حريف حريف » 
الحريف ۲ 
حزفاء 
الحرفاء ١‏ 


الجدول (YA)‏ عمیل ومرادفاتها 2 الدونة 


الأوروبي تفید أن تونس تعد الحریف الثالث والعشرین للمفرب وبینما تحتل 


آما حصة الغرب التي تعد الحریف الحادي عشر لتونس والسابع والثلائین 


اراء المضيفين وا لضیفات وكذلك بعض الحرفاء الاوفیاء التعلقة باقتراحات موجهة للادارة 


الجدول (۲۹): الواضع التي ودت فيها ( حريف) بمعنی (عمیل) 
وي مقابل هذه الأبنية الجديدة. هناك کلمات آخری 2 مادة (Jeg)‏ ذات 
أبنية كانت مستخدمة سابقا ولکن بدلالات مختلفة عن دلالاتها العاصرة. ومن 
ذلك كلمتا (حملة) و(عمالة) «مثلثة الفاء»» فهاتان الکلمتان كانتا تعنيان 2 
السابق وآخرة العامل على ما بذله من عمل». ولكن تحول معنى (عملة) وأصبحت 
تستخدم ‏ الدلالة على نوعية النقد المستعمل 2 التبادل التجاري والاقتصادي. 


۳۹۰ 


| datati هذه‎ 


اخداء صن المركر 0 
ولايسمح بنشرغا ورقيا -— 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 
2 د بناؤها وطرائق الإفادة منها 


2 مقابل كلمة (currency)‏ الانجليزية. وكذلك (عمالة) أصبحت تدل غالبا 
على مجموع القوی العاملة. ویلخص الجدول (۳۰) تکرار هاتين الکلمتین 2 
الدونة ومجالاتها الفرعية. 


das الكلمة — ريض خصد سيس دين علم‎ 
Y Y ۳ ۵ M ۰ 5 عملة عملة‎ 
11٤ ۳ ۸ AV Y Y العملة‎ 
un . . t ۱۱ ` ١ عمالة عمالة‎ 
Ww ۳ ۲ ۵ £Y ۰ ۵ العمالة‎ 
YYA 0 ۸ ۳۲ ۱۲ ۲ Y^ المجموع‎ 


الجدول (Y)‏ تكرار كلمتي (عملة) و(عمالة) ج المدونة 

ومن ناحية آخری, فقد لا تتحول دلالة المفردة بشكل كامل؛ ولكن يلحقها نوع 
من التقييد والتخصیص. وعلى سبيل JEL‏ فاسم الفاعل لوصف العاقل من (ع 
(Je‏ (عامل) الذي يدل على من يقوم بالعمل أو يشتغل 2 حرفة معينة له جمعا 
تكسيرء هما: عَمَلة وعَمّال. 2:5 القدیم. كانت كلمة (Lac)‏ تستخدم للإشارة 
إلى الولاة ومن يلون أعمال السلطان. مثل (عمال uall‏ وعمال الأمصار). 
(aké) Lis‏ فكان يدل غالبا على من يشتغلون بأيديهم -2 أعمال تتطلب الجهد 
البدني كالحفر ونحوه (انظر: لسان العرب لابن منظور. 501/5). وأما .2 
العصر الحدیث. فقد اندثر استخدام (عملة) تقريباء وتغيرت دلالة (Jhe)‏ 
فأصبحت تستخدم أكثر 4 الاشارة إلى الحرفیین من ذوي الدخل النخفض 
وآصحاب الصناعات اليدوية والهن الشاقة. وآما جمع التصحیح (عاملون) 
فیستخدم بمدلول عام للإشارة إلى جمیع من يعمل 2 مجال معين من الوظفین 
وغیرهم. وهذا الاختلاف بين الکلمتین جار على الاصل OM‏ جمع التصحیح يدل 
غالبا على مطلق الوصف الناسب لدلالة مادة الاشتقاق. وآما جمع التکسیر فیدل 
على تسمية مقصودة لصنف خاص(۲۸). وربما یوضح الکشاف السياقي لعينة 


شنه العظيعة 


إضداء من المركز 


ولايسمح بنشرها ورقيا 


al‏ تداولها تساريا 


عشوائية من استخدام هاتين الكلمتين التفاوت 2 مدلوليهما كما 2 الجدولين 


(۲۱) و(۲۲). 
الأفضل فهذا لیس من شأن 
الانتاج الامانية الاسبوع الاضي ان 
التجار ویسرق من تعب وعرق 
ان تستمر -2 تجاهل مطالب 
العمال وتمنی من الدولة انصاف 
ومن لا يريد الدفاع عن 
وتحميل السفن وبالنسبة للكثير من 
ما يصعب كثيرا علينا وعلى 
ومن ثم لا يبقى أمام 
النقابات حول ضرورة تأسيس اتحاد 


بحيث يتم إعادة المسرحين من 


أو البعيدة يخرج لك كل 

وهذا يدل علي ان ثلثي 

تذليلها وهذا هوالمطلوب وبما يشجع 
النبي صلى aill‏ عليه وسلم 

ولبث روح الأمل # نفسية 


والمؤتمرات بصفة دائمة بهدف إطلاع 
الأربعة أضعاف كما تضاعف عدد 

ج المائة من إجمالي عدد 

خاصة أصحاب الدخول المنخفضة من 
أنها تستقطب النسبة العظمى من 


الدولية شاكرا 2 ختام كلمته 


المنفذين بل ریما يلتفت الیهم 

الصینیین الذي ينتجون الاحذية یحصلون 
وتابع نرید نقلا عاما أسوة 

ومطالب حرکتهم النقابية وآعتبر الکتب 
والعائلات الحرومة بدلا من انقاص 
وحقهم فلیرحل وقال الفلاء طال 

فان عملهم صعب للفاية بسبب 

أثناء عملیات الحفر هذا إلى 

سوى تركيب هذه الأجزاء وطلاء 
الزراعيين ‏ روسیا ص المصدر 


إلى المصانع وإعادة تنشيط الحرف 


2 هذه المؤسسات موجهين كل 

تقريبا لايحصلون علي تامين صحي 
-2 هذا القطاع على عرض 

2 الأعمال الخيرية والمساهمين سواء 
2 حقل الدعوة يبشر سراقة 

بالوزارة على كل جدید وحدیث 

2 هذا القطاع فازداد عددهم 

-2 دول مجلس التعاون 2 

2 الدولة والقطاع الخاص والعاشیین 


2 القطاع الخاص 2 سورية 


2 المؤسسة ومد ارس التحفیظ مترحما 


الجدول (YY)‏ نموذج من الکشاف السياقي لكلمة ( العاملین) 2 الدونة 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


ولو آردنا الاستمرار 2 مادة (ع م (J‏ ولكن 2 الأفعال هذه المرة فسنجد أن 
الفعل ( استعمل) يدل على عدد من العاني. فهو على صيغة ( استفعل) . والمعنى 
الأصلي لهذه الصيغة هو الطلب. فمن معاني ( استعمل) : سأله أن يعمل له أو طلب 
إليه العمل. ومن معاني هذه الصيغة أيضا الاتخاذ. ولذا فمن معاني ( استعمل): 
جعله عاملا له. وقد تدل أيضا على اتخاذ الشيء أداة أو وسيلة يعمل بها. وهذا 
العنی الأخير هو الباقي 2 الاستخدام المعاصر. وك مقابل ( استعمل) هناك فعل 
آخر على صيغة ( استفعل) كان مقصورا 2 دلالته القديمة على معنى الطلب. ولم 
يكن يستخدم # معنى الاتخاذ. وهو الفعل ( استخدم)؛ ولكن تحولت دلالته 2 
الاستخدام العاصر. فأصبح يستخدم 2 معنى الاتخاذ كمرادف ل( استعمل), 
كما يوضح أحد الباحثين: 

«يقول العربون 2 عصرنا مثلا (یستخدم هذا الدواء لاتقاء البرد) . والمراد 
هنا يستعمل. ويقال: (يستخدم هذا الفعل بمعنيين...): بمعنى يستعمل. وكأن 
الفعل (استخدم) مرادف للفعل (استعمل). وإذا عدنا إلى فصيح العربية 
وجدنا الفعل ( استخدم) بعيد عن معنى ( استعمل) . قال Jal‏ العربية «استخدمه 
فآخدمه. آي استوهبه خادما فوهبه له. ويقال: اختدمت فلانا واستخدمته: أي 
سألته أن يخدمني». وعلى هذا كان الفعل لا يفارق سياق الخدمة. وهذا كله لا 
نجده 2 استعمال المعربين ل عصرناء O‏ 

ورغم آهمية هذا النص 3 التنبیه على الدلالة الجديدة لكلمة (استخدم) 
2 العربية العاصرة. ألا أنه لا يقدم أي معلومات عن مدی شیوع كل من الکلمتین 
3 الاستعمال الفعلي, ولا مدی التطابق بين دلالتیهما 2 الاستخدام العاصر. 
وبالبحث عن فعلي ( استخدم) و( استعمل) ومصدریهما 2 مدونتنا فقد تبين أن 
استعمال ( استخدم) آکثر بکثیر من (استعمل) كما یوضح الجدول رقم (YY)‏ 
(۳۹). وآما من ناحية الدلالة فهذا الفعلان یستعملان بمعنی واحد؛ يدل على 


AY السامرائی. ۰۱۹۹۵ ص‎ (Y) 


YAY 


Wi‏ المدونات اللغوية العربية 


ne DE‏ بناؤها وطرائق الإفادة منها 


شنه العظيعة 


إهداء من المركز 


ولايسمح بنشرها ورقيا 


او تداو لیا تسا با 
.1 — — 


اتخاذ شيء ما lal‏ ولا يوجد فرق بين دلالتهما كما توضح عينة عشوائية من 
الكشاف السياقي لكلا الفعلين 2 الجدولين (Y£)‏ و(۳۵). 


الكلمة استعمل يستعمل 
العدد ۳۳ ٤١‏ 


الجموع ۳۷ 


استخدم يستخدم استخدام 
ع ۱۹۵ YA‏ 


101۷ 


الجدول (YY)‏ تكرار كلمتي (استعمل/استخدم) ومصدريهما -2 المدونة 


العلماء الاختبارات الجينيه لتحديد الاف 
مختلف اسلحه الدمار الشامل وساهموا 
مضادات الحموضه التي تباع دون 
وساده عاليه قليلا وذلك للتقليل 
عبارات اقل عنفا فان فكرته 

عائلته كلها .2 سبیل al‏ 

الفرح بدل الغضب فقال الفرح 
المشاركون دراجه ثابته وساقوها بنشاط 
الاخر الغاز المسيل للدموع ورشه 

العون عصاه لضرب الشاب ورغم 
الاخر الغاز المسيل للدموع ورشه 


طائرات من دون طیار بشکل 
عبارات امرو القیس -2 معلقته 
الباحتون لائحة بيك وهو نظام 
هذا الاسلوب افلا ينظرون إلى 
مناهج عدة منها على سبيل 
المفاتيح لأبوابها ومنهم عاند المفاتيح 
الجيش قوته كحاكم للبلاد من 

كل الاسالیب الملتوية ففجأة يحصل 
الجنوبيون البنادق والحراب 4# قتل 
الفراعنه العسل فى التحنيط كما 
فيها نوعا من أنواع المونتاج 


الى الجرعه العاديه منذ ele‏ 

نبي رغم انهم اول من 

المعده كلما زادت كميه افرازاتها 
والطريقه التي يصفها لك الصيدلي 
بحيث يتبين لو كان قد 

بكر الصديق رضي اللّه عنه 
الغضب الساطع ات ولكن الشاعر 
قفي الساعه الحاديه عشره صباحا 
واحد ولم یکفهم ذلك بل 

عليه وهنا بدا الخلاف حيث 

واحد ولم يكفهم ذلك بل 

المشرفين على التنظيم والامن الذي 


الشرق الأوسط والمحيط الهادي أوباما 
واللافت ‏ الأمر أن شاعرنا ٠‏ 

طول أصابع الرجال والنساء ثم 

هذه واحدة من الطرق والقران 

افادته كثيرا 2 دراساته فهو 

فترة احراز الفاتیح فمن متخرج 

مرسي يستخدم صلاحیاته کرئیس مثلما 
التمرد الدموي 2 اغسطس حيث 
القدماء العسل كغذاء ودواء وقد 

-2 روایته الثانية الکلا التي 


الجدول (Yo)‏ عينة من الکشاف السياقي لكلمة ( استخدم) 


هذه االحقبعة | 
إخداء من المركر 
و لایسمح بنشرها Led pg‏ 


أو تداو لها تجاریا Wi‏ المدونات اللغوية العربية N‏ 


تا مد بناؤها وطرائق الإفادة منها 


مناقشة نتائج الدراسة 

انوطعا نف هذا ابس عرد فخ الأ ال وضع كيف يكن أن 
تستخدم الدونات ب2 البحث والتحليل اللغوي. وكما يظهر من النتائج السابقة 
فإن أهم ميزة للسانيات المدونات هو أنها تقدم منهجية اختبارية تعتمد على 
الأدوات الحاسوبية والتحليل الكمي الإحصاثي لعينات وبيانات اللغة كما تستخدم 
فعلا 2 الواقع ومجالاته التواصلية الختلفة. ورغم أن هذا مهم جدا كما رأينا 
2 استخراج نسب التكرار والشیوع. وتحول الدلالات. والقارنة بين المترادفات, 
بالإضافة إلى التعرف إلى المفردات المميزة للمجالات التواصلية الختلفة. إلا 
أن هناك ملاحظات ينبغي الانتباه لها. منها أن لسانيات المدونات تركز بشكل 
أساسي على الجوانب المعجمية 2 اللغة. ولكن ذلك لا يعني استبعاد أو إهمال 
القضايا النحوية. فعلاقة المعجم بالتركيب علاقة متداخلة. ولها مستويات 
متعددة(۶۰). ومن نقاط الالتقاء المهمة بين المعجم والتركيب الكلمات الوظيفية 
التي تلعب دورا نحویا 2 المقام الأول عبر ربط مكونات الجملة لتكوين وأداء 
وظائف معينة. 

وکما رآینا فان الکلمات الوظيفية هي الأكثر بروزاً وتكرارا ج الدونة. وهذه 
النتيجة ليست ial lies‏ بل هي التوقعة 2 أي مدونة لغوية, فالکلمات الأكثر 
lagu‏ 2 کل اللفات تنتمي غالبا إلى الکلمات الوظيفية الفلقة (انظر مثلا: 
.(Curzan & Adams, 2012, p. 2‏ ودون الد خول 2 تفاصیل دقيقة وکثیرة. 
فان معاودة الوقوف على الکلمات الوظيفية بناء على نتائج لسانیات الدونات 
مهم جدا لسببین: آحدهما نظريء والآخر تطبيقي. آما النظري فهو أن يعاد 
النظر .2 موقع هذه الکلمات الوظيفية وآثرها 2 البناء اللفوي بناء على تصور 
نظري موحد وشامل. فقد اعتاد النحاة على تناول هذه السألة بشکل موزع 
ومتفرق ضمن مباحث النحو العامة. ورغم أن بعضهم آفرد «حروف العاني» 


۳۱۵ 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداولهيا تسا با 


بالعناية والتآلیف. الا أن حروف العاني آضیق مما نقصده هنا. لأن الکلمات 
الوظيفية تشتمل بالاضافة إلى حروف العاني على «البهمات» مثل الضمائر 
وأسماء الاشارة والأسماء الوصولة(۶۱). كما تشتمل آیضا على «الأدوات 
المحولة» (حسان» ۰۲۰۰۱ ص ۱۲۳) التي تعد من قبيل nl‏ النحوية وتعمل 
عملهاء ولكن النحاة لا يتناولونها ضمن حروف العاني لأنها تنتمي إلى قسمي 
الأسماء أو الأفعال 2 التقسيم النحوي التقليدي لأقسام الكلام(49). 

وأما السبب التطبيقي فيتعلق بالمعالجة الإحصائية لهذه الأدوات كما تتحقق 
2 واقع الاستخدام الفعلي. فغياب الدراسة الإحصائية جعل النحاة يتناولون 
2 حروف المعاني حروفا نادرة الاستخدام أو منقرضة مثل (جیر. جلل. عوض» 
بجل) علي نس المستوى بع حروف أخرى شائعة ومتكررة. كما جعلهم يتناولون 
أيضاً حروفاً مرتبطة غالبا بالستوی الشفهي مثل (Jul)‏ أو بظواهر لهجية 
خاصة مثل (الیم. والشين) (انظر مثلا: الجنى الداني للمرادي ص ۱۳۹و 
۲) مع غيرها بلا تمييز. ومن شأن الدراسة الإحصائية أن توضح نسبة تكرار 
الأدوات وشیوعها. ومواضع تكرارها واستخدامها. ومن ذلك مثلا أن حرف الجر 
)2( « كما رآینا » هو أكثر الحروف تكرارا 2 العربية بسبب تعدد معاني هذا 
الحرف وتداخله الدلالي مع عدد من الحروف الأخرى رغم أن معناه الأصلي 
هو الظرفية (انظرء مثلا: الشریف. ۰۱۹۹۰ .)701١/7”‏ وقد تؤدي الدراسة 
الإحصائية أيضا إلى بيان بعض الاختلافات بين ما يقرره النحاة من أحكام 
وواقع الاستعمال الفعلي(؟5) (انظر مثلا: الربطة. ۲۰۰۰). وهذا يتأكد .2 
واقع الاستخدام اللغوي الحالي ل»الفصحى المعاصرة». فكما رأيناء هناك آدوات 
وتعبیرات مثل (حول) و (من خلال) أصبحت ضمن الأكثر تكراراً بسبب التأثر 
بالترجمة والأساليب المعاصرة(٤٤).‏ 

ومن ناحية أخرىء فإن استخدام المدونات لا يقتصر على تتبع الأدوات 
والكلمات الوظيفية. بل هناك مجال واسع لاستخدامها 2 الدراسات المعجمية 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداو لیا تسا با 


المتعلقة یکلمات الحتوی. وهذا الجانب بالذ ات له ارتباط کبیر بدراسة «الفصحی 
العاصرة» لأن من آبرز خصائصها تجاوز العجم التراثي واستحداث کم هائل 
من الأبنية والدلالات والأساليب الجديدة. وکما رآینا فان الصحافة مورد 
ثري للغاية يزخر بعدد وافر جدا من الفردات والدلالات الجديدة. فبعضها 
استحدت آساسا 4 الصحافة. وبعضها عملت الصحافة على اذ اعته وانتشاره. 
ومع ذلك فاقصاء الصحافة لا یزال هو الوقف السائد ب2 الدراسات اللغوية 
(الحمزاوي. ۰)۲۰۱۱. ومن نتائج ذلك فقر العاجم العربية الحديثة 2 مقابل 
العاجم الاستشراقية التي اعتمدت إلى حد کبیر على لفة الصحافة 2 تتبع 
المستحدث والستجد 2 اللغة العربية (للاطلاع على بعض الأمثلة؛ انظر: کنون. 
۲۳ الحمزاوي. ۲۰۰۳). وحتی الذین یهتمون بهذا الجانب. یعتمدون على 
التتبع العشوائي لأمثلة جزئية ومتفرقة حسبما یتفق. دون الاستناد إلى منهجية 
| حصائية منضبطة. ومن نتائج ذلك اضطراب العاییر 2 اعتبار وادراج الفردات 
والدلالات الجديدة 2 العجم. ومن آمثلة ذلك - كما رأينا - خلو مادة «خ د م» 
2 (العجم الوسیط) من الدلالة الجديدة لكلمة «استخدم» کمرادف ل»استعمل» 
رغم شیوعها وانتشارها الکبیر. 2 مقابل إدراج کلمات جديدة آقل منها تکرارا 
بكثير مثل (زبون) و(عمولة) . 

كردا على ما بدآنا به هذا البحث. فإن مفهوم «الفصحى العاصرة». 
ومراحل تطور العربية بشكل عام لا يمكن تأسيسهما على الانطباعات الذاتية, 
والدراسات الجزئية المتفرقة. فالتناول الجاد لهذه المسائل يتطلب الاعتماد على 
الحصر الاستقصائي والاحصائي للظواهر اللفوية # كافة مجالات التداول 
اللغوي الختلفة. مع مقارنة تلك المجالات بعضها ببعض من ناحية. ومقارنتها 
بمراحل التطور التاريخي الختلفة للغة العربية من ناحية آخری. ولسانيات 
المدونات تمثل آلية ومنهجية منضبطة ومناسبة جدا لتحقيق ذلك. ولكن ذلك 
يتطلب دراسات مؤسسية متتابعة ومتراكمة مع استخدام مدونات لغوية متنوعة 


۳۷ 


Wi‏ المدونات اللغوية العربية 


تا ne‏ بناؤها وطراثق الإفادة منها 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ب — 


ومختلفة 2 محتوياتها وتمثيلها التاريخي. وربما يؤدي تراكم البحث 4# هذا 
الاتجاه إلى استخلاص تصورات واضحة ومستندة إلى نتائج اختبارية + مجال 
لا يزال يعاني من التعميمات الانطباعية بلا مستند واضح. والصحافة المكتوبة 
بالذات منذ مطلع النهضة العربية الحديثة تمثل وثيقة تاريخية مهمة جدا تحتوي 
على مسارات حركة اللغة العربية وتطورها خلال القرنين الماضيين. فدراستها 
بناء على النهجية الستخدمة نك لسانیات الدونة إضافة مهمة جداء واتعدام 
ذلك لا یزال يمثل فجوة معرفية 2 الدراسات اللفوية العربية. 

وآخر ما یمکن الاشارة إليه 2 هذا الصدد هو أن استخدام لسانیات الدونات 
2 الدراسة اللغوية - رغم آهمیته الکبيرة - له متطلباته الخاصة. وبرنامج 
(غواص) الذي استخدمناه 2 معالجة وتحلیل بیانات الدراسة الحالية ليس الا 
نموذجا للادوات الحاسوبية التي یتطلبها العمل على لسانیات الدونات. ورغم 
آننا واجهنا بعض الشکلات 2 استخراج بعض الکلمات مثل الادوات اللتصقة 
بالکلمات الصاحبة لها (مثل «السين» و,آل» التعریف) . والکلمات التي یتطلب 
التعرف على نوعها الخاص أن تکون مشكولة (مثل «مّن» الوصولة. و»من» حرف 
الجرء و»عمل» «Jae «aal‏ المصدر) كما أشارنا إلى ذلك الا أنه كاف 2 
unu‏ اضرا النتائج التي US‏ نصبو إليها 2 هذا الفصل. وهناك eli‏ 
أخرى من التحليل اللغوي تتطلب مدونات موسومة وأدوات معالجة ذات وظائف 
إضافية. ولذا فإن لسانيات المدونات تتطلب التعاون الجاد والوثيق بين اللسانيين 
والحاسوبيين من أجل تطوير آليات التحليل والأدوات الحاسوبية المناسبة لمعالجة 
ظواهر وقضايا ومسائل اللغة العربية. 


الخاتمة 


لقد كان الهدف الأساسي لهذا المبحث هو عرض نماذج توضح بعض 
cdl‏ استخدام لسانيات المدونات ب4 دراسة اللفة. وكان تركيزنا منصبا 


1۸ 


| Rasa هلد‎ 


اخداء من mu 5$ A!‏ 
ولايسمح بنشرها ورقيا -— 8 
أو تداو لیا تسار با 6 المدونات اللغوية العربية 
1 بناؤها وطرائق الإفادة منها 


على دراسة بعض الظواهر اللفوية .2 «الفصحی العاصرة» عبر استعراض 
بعض النماذج والأمثلة لانواع التحلیل الممكنة 2 هذا الصدد. ورغم Lil‏ قدمنا 
بعض النماذج مثل استخراج الکلمات الشائعة والکلمات الميزة والقارنة بين 
os soa‏ إلا أن Led cli‏ آخری رتخد امات ری pE‏ 
للسانیات الدونات لم تتسع لها | لساحة التاحة. ومن الأمثلة الهمة ذ ات الارتباط 
ب»العربية العاصرة» التي كان یمکن أن نتناولها بالدراسة قضایا التعدية واللزوم 
واستخدام حروف الجر مع الافعال. وقضایا الاسالیب الستجدة. بالاضافة إلى 
الدراسات التعلقة بتحلیل الخطاب. ولکننا نكتفي بهذا القدر لأن القصود هو 
تقدیم نموذج فقط لنوعية الدونات. والأدوات الحاسوبية. وأنماط التحلیل التي 
یمکن استخدامها 2 لسانیات الدونات. 


الحواشي 

(۱۷) نود أن نشکر الزمیل الد کتور منصور ميغري على تفضله بقراءة مسودة 
هذا البحت. واللاحظات القيمة التي زودنا بها. كما نشکر الد کتور 
صالح العصيمي على متابعته ومراجعته لهذا الفصل وملاحظاته 
القيمة. 

(۱۸) حركة النهضة العربية ابتدآت 2 مطلع القرن التاسع عشر اليلادي. 
نتيجة لعوامل كثيرة ومتعددة. وتأثرت بها البلدان العربية بنسب 
متفاوتة ومختلفة. وقد کتب عنها الکثیر من الناحية التاريخية 
والاجتماعية. وللمزید حول بعض الاثار الفكرية واللفوية. انظر: 
حوراني £A‏ الشیال. NAON‏ 


)4( لابد من التنبیه هنا على أن هناك من یعارض مصطلح «العربية 
العاصرة» (انظر على سبيل الثال: بشرء 1555(« ویری أن هذا 
الصطلح يوحي باختلاف العربية العاصرة عن العربية 2 العصور 


۳۹ 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


السابقة. ولکن كمال بشر نفسه الذي آطال 2 انکار مصطلح «العربية 
العاصرة» یقبل مصطلحا آخر مشابها له: «العربية 4 العصر 
الحدیث». وید عو الیه, ولا ینکر اختلاف مستويات الاستخدام اللغوي 
ولا وجود بعض السمات واللامح التعبيرية والأسلوبية التي تخص 
العربية ب4 العصر الحدیث ( انظر: بش ۰۱۹۹۹ ص 05(« 


(۲۰) إبراهيم السامرائي. على سبیل التال. من اللغویین العرب الذین 
كانت لهم عناية بهذا الوضوع. وله جهود بارزة -2 تتبع بعض الظواهر 
المستجدة 2 العربيةء ويقول 2 دراسة مبكرة 3 هذا الصدد «وهذه 
أشتات جمعتها من هنا وهناك. ولم أتبع 2 جمعي هذا منهجا خاصاء 
فمنها ما شاع 2 لغة الصحافة اليومية. ومنها ما هو جار على ألسنة 
الذیعین, ومنها ما هومستعمل 2 لغة الكتابة الخاصة. وأعني بالخاصة 
لغة الكتابة غير الأدبية كالألفاظ الاقتصادية والسياسية ونحو ذلك» 
(السامرائي. NAVY‏ ص Ya. (OV‏ يزال هذا الأسلوب هو السائد والمتبع 
2 دراسة ظواهر الاستعمال اللغوي 2 «الفصحى المعاصرة». 

(۲۱) السجلات/15]655اعع1.  Genres/css alls‏ من مصطلحات 
اللسانيات واللسانيات الاجتماعية للتمييز بين مستويات وأنماط 
الاستخدام اللغوي المختلفة. ويختلف تعريفهما تبعا لاختلاف النظريات 
اللغوية. ولكن بشكل عام. تستخدم «السجلات» للإشارة إلى ارتباطات 
النصوص بالجالات والسياقات الاجتماعية الختلفة. وأما »الضروب» 
فتستخدم للإشارة إلى فتّات النصوص المختلفة وما تشتمل عليه من 
انتظامات داخلية وشكلية تمنحها هويتها المميزة (وللمزید. انظر: 
Biber & Conrad, 2009:Lee, 2001‏ (. 

(۲۲) لابد من التنبيه هنا إلى أن المكانة النظرية للسانيات المدونات مسألة 
خلافية. ففي حين ينظر لها الأغلبية على أنها مجرد منهجية بحث 


ys 


| FEWUCLLIEMTT 


اضدا: من المركر o‏ 
والايسمح بنشرغا ورقيا -— 8 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 
mm‏ بناؤها وطرائق الإفادة منها 


اختبارية. يرى بعض الباحثين ( 2001 Tognini-Bonelli,‏ ( أنها لا تخلو 
من منطلقات نظرية تخصهاء بل يذهب بعض الباحثين Sinclair,)‏ 
2004( أبعد من ذلك. ويعتبر أن لسانيات المدونات بذاتها تمثل اطارا 
نظريا جديدا وبديلا للبحث اللغوي. وقد ناقش ماكنري وغابريلاتوس 
(McEnery & Gabrielatos, 2006)‏ هذه المسألة بتفصیل gl‏ سع. 

2- نفترض هنا أن القاریّ. بناء على ما قدم 2 المباحث السابقة‎ (YY) 
2 هذا الکتاب. على وعي ودراية بأنواع التحليل الممكنة والستخدمة‎ 
لسانيات الدونات. ولذا فإننا لن ندخل 2 بیان التفاصيل .2 هذا‎ 
۲۰۱۳ الصدد (وللمزید یمکن الرجوع الی: صالح, ۲۰۱۲؛ العصيمي,‎ 
. (Hunston, 2006 وأيضا:‎ 

(Y£)‏ ونود أن نوضح هنا أنه يوجد اختلاف طفیف .2 حساب عدد کلمات 
الدونة بين ما ذکرناه هنا. وما هو وارد 2 الورقة العلمية التي نشرت 
عن الدونة سابقا )2013 Al-thubaity et al.,‏ (. حيث تشیر الورقة 
إلى أن عدد کلمات الدونة هو ۰۲۰۲۰۷۰۶7۹ .2 حبن أن ما وجدناه هو 
6 أي بفارق ۰۲۳۰۰۹۶ ویعود السبب 2 ذلك إلى استخد امنا 
لنسخة محدثة من غواص حسنت من طريقة حساب کلمات الدونة. 

(Yo)‏ آدت الاضطرابات السياسية 2 بلدان مثل لیبیا وسوریا إلى تعطل 
الکثیر من مواقع الصحف مما آثر بشکل واضح على عدد النصوص 
الجموعة من تلك الدول. 

(Y1)‏ رغم أنه یمکن استعراض جمیع الکلمات الواردة 2 الدونة الا آننا 
سنكتفي هنا بالحديث بشکل موجز عن الکلمات المئة الأكثر تکرارا 
سواء 4 المدونة كاملة أو 4 أجزاتها المقسمة على المجالات المختلفة. 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


(YV)‏ هذه المصطلحات متد اخلة وتستخدم بمدلولات مختلفةء ولكن «الكلمات 
الوظیفیة». وهي كلمات تنتمي Aia cl‏ مفلقة. تؤدي وظائف نحوية 
.2 المقام الأول ولیس لها دلالة مرجعية غالياء أوسع من «الادوات». 
لأنها تشتمل على «الأدوات» وما يشبهها كالضمائر وأسماء الاشارة 
والموصولات. و«الأدوات» أشمل مما اعتيد على تسمیته ب«حروف المعاني» 
2 التراث النحوي ( انظر مثلا: الساقي. ۰۱۹۷۷ ص ۲۱۲). وسنتوقف 
لتوضيح ذلك بشكل موجز 2 الجزء المخصص لناقشة نتائج الدراسة. 

(۲۸) ولذا فإن نحاة أهل الكوفة يجعلون الأسماء المبهمة التي تلازم الظرفية 
(انظر: الأصول لابن السراج ۲۰۶/۱). ورغم أنه يذكر ذلك -2 معرض 
النقد والتشنيع عليهم بسبب عدم تفريقهم بين الحروف والأسماء. إلا 
أن ذلك يدل على احساسهم بمدی قرب هذه الکلمات من الحروف 
والکلمات والوظيفية. وشبیه بذلك ما نسب إلى سیبویه ونحاة آخرین 
eel‏ یجعلون (ule)‏ اسم ظرف. ولا یعدونها ضمن حروف الجر 
(انظر: البحر الحیط لأبي حیان. ۱۶۵/۱). وهذا جزء من اختلافات 
طويلة ومتشعبة 2 النحو العربي حول انتماء Sde‏ کبیر من الکلمات الى 
«أقسام الكلم» المختلفة. ورغم أننا لن نتطرق إلى هذا الوضوع. إلا آننا 
سنشير إلى ما يترتب على ذلك من مقتضيات 2 الجزء الخصص 
لمناقشة نتائج الدراسة. 

dS YA)‏ من التئییه إلى أنه بسیب عدم عرض الحركات فان «من» هنا قد 
تكون «من» مكسورة الميم التي هي حرف جر أو «من» مفتوحة الميم 
التي تكون اسما موصولا أو اسم استفهام. ويمكن التحقق من ذلك عبر 
الکشاف السياقي. ولكن ذلك خارج عن مقصودنا هنا. 


شنه العظيعة | 


اضدا: من المركر 0 
و pias Y‏ بنشرغا Lä ja‏ -— 8 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


(۲۰) لابد من التنبيه هنا إلى أن حروف المعاني الأحادية والملتصقة بالكلمات 
اللاحقة لا تظهر 2 التحليل بسبب اعتبارها جزءا من الكلمة؛ ولذا فان 
واو العطف. و( آل) التعريف اللذين يتوقع أن يكونا من أكثر الأدوات 
تكرارا لم يظهرا كما هو متوقع. ورغم وجود برامج تتيح التعامل مع 
هذه الشكلة. إلا أننا لم نستخدمها لسببين: آولا عدم دقتها 2 بعض 
المواضع؛ والثاني خروج ذلك عن مقصودنا الأساسي» وهو الاكتفاء 
بعرض بعض النماذج والعينات. 

(Y!)‏ لاحظ أن «الظروف» كلها تتضمن معنى مي باطراد (انظر مثلا: 
حسن.۲۶۲/۲۰۱۹۷۲؛ السامرائي, ۰۲۰۰۰ ۱۷۸/۲). 

(YY)‏ ومن ناحية آخری. يرتبط هذا الفعل بمبحث آساسي بك الترکیب 
المعاصرء وهو أفعال العماد/ Support verbs‏ أو «الأفعال الناقلة» وهي 
أفعال من قبيل الحشو لانها فارغة دلاليا تقريباء ولا تمثل ركنا .2 
الاسناد. بل يقتصر دورها الأساسي على الوصل بين ركني الاسناد 
2 الجملة. ويعد شيوع استعمالها من الخصائص المميزة 2 العربية 
المعاصرة (انظر للمزيد: ۰۸۹/120 ۱۹۹۲؛ الورهاني. .)5٠١/‏ 

(YY)‏ ومن المعربات القديمة التي وردت ضمن الكلمات المميزة 4 هذا المجال 
كلمة (رصيد)؛ وهي من الكلمات التي توضح خفاء حركة الاقتراض 
اللفوي 2 بعض الأحيان (انظر: السفروشني: (AS‏ 

(Y£)‏ لابد من التنبیه هنا إلى أن الحکم بأن هذه الأبنية جديدة لیس آمرا 
یستنبط من الدونة. إلا إذا كانت مدونة تاريخية تتیح تتبع تطور الالفاظ 
عبر الراحل الزمنية الختلفة. ومدونتنا ليست كذلك. ولذا فان الحکم 
ob‏ هذه الأبنية أبنية مستحدثة حکم مسبق اعتمدنا فيه على العاجم 
الحديثة مثل (العجم الوسیط). وعلی کلام بعض الباحثين مثل 


YAN 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 
ءكءكد —— 


الدكتور ابراهیم السامرائي (avy)‏ الذي يقول 2 كلمة «عميل» مثلا 
«لا يوجد 2 العربية صفة «فعيل» من هذه المادة؛ فالكلمة .2 صورتها 
الاشتقاقية جد ید 5؛ ومعناها جديد أيضا» (Y oe)‏ 


(Yo)‏ هذه الرموز تشير إلى المجالات الفرعية 2 المدونة ف( ثقف) تشير إلى 
الجال dag. Ld‏ و(كمل) تشير إلى المدونة كاملة. 

(Y1)‏ المصدر على وزن (فعولة) الأكثر على أنه سماعي, وبعضهم يرى أنه 
قياسي -2 باب (فعل» يفعل) مثل (صعب. يَصعب. صعوبة). ولكن 
یلا حظ أنه مر معنا مصدران جديدان مبينان على هذه الصيغة وليسا 


من هذا الباب (سيولة. عمولة) . 


(YY)‏ ورد 2 لسان العرب لابن منظور (۰۱۹۹۹ ۱۳۰/۳) «وفلان حريفي 
أي معاملي....وحریف الرجل: معامله 2 حرفته» (...): وانظر آیضا 
(السامرائي» ۰۱۹۷۳۲ ص (VY‏ 

(YA)‏ هذه نقطة ب غاية الأهمية. ولا یتسع الجال للتفصیل. وللمزید 
حول هذا الفرق الدلالي بين جموع الصحة وجموع التکسیر. انظر: 
السامرائي. ۰۲۰۰۷ ص ۰۱۲۷ وللدکتور محمود الطناحي (۱۹۹۲) 
دراسة قيمة 2 بیان آثر العرف اللغوي 2 تقييد دلالات آبنية جموع 
التکسیر. ومنه استوحینا فكرة القارنة بين جموع (عامل). واختلاف 
دلالة أوزان الجموع من الأبواب التي تحتاج إلى دراسة ولم تحظ بعناية 
كبيرة (انظر مثلا: السامرائي. ۰۲۰۰۷ ص ۰۱۱۳ فبعض الأوزان 
تختص بمجال دلالي معین مثل كلمة (عباد) التي تختص « كما مر منا 
-2 الجدول (۲۰) » بالجال الديني. بخلاف کلمة (عبید) . وکلاهما 
جمع تکسیر لکلمة (عبد). 


| aula هلد‎ 


اخداء من mu 5$ AI‏ 
ولايسمح بنشرها ورقيا -— 8 
أو تداو لیا تسار با 6 المدونات اللغوية العربية 
2 — بناؤها وطرائق الإفادة منها 


(YA)‏ ومع ذلك لم يشر المعجم الوسيط إلى هذه الدلالة الحديثة لكلمة 
(استخدم) رغم عنايته بما طراً 2 العربية من كلمات محدثة ومولدة, 
ولكن هذا المعنى موجود 4# (معجم اللغة العربية المعاصرة) لأحمد 
مان عمو (Yes)‏ 

(۶۰) لابد من التنبیه هنا إلى أن النظریات اللسانية تختلف فیما بینها 
2 تصور طبيعة العلاقة بين النحو والعجم. ففي حين أن النظرية 
التوليدية, خصوصا 2 مراحلها الأولىء تؤكد على آسبقية واستقلالية 
الترکیب بمعزل عن العنی. نجد أن النظرية النظومية. لمايكل هالدي 
ومن یتابعه. تشدد على وحدة النحو والعجم واعتبارهما دعامتین 
«Uu!‏ واحد «the lexico-grammar cline»‏ ( انظر: & Halliday‏ 
(£Y .- ۰۲۰۰۶ .Mattiesssen‏ 

(۶۱) وكما رأينا سابقا فإن الظروف المبهمة التي تلازم الإضافة غالبا أو 
دائما مثل ion»‏ قبل. بعد. دون...» من قبيل البهمات. وتندرج ضن 
الکلمات ذات التکرار العالي. ورغم کونها من قبیل کلمات الحتوی؛ الا 
أن إبهامها الدلالي المتأصل یجعلها قريبة جدا من الکلمات الوظيفية 
(وانظر أيضا: کافل: (rs VE‏ 

2. كما هو واضح فإن هذه المسألة مرتبطة بتصنیف آقسام الکلام‎ (EY) 
النحو العربي. والتقسیم الثلاثي التقليدي لاقسام الکلام: اسم. وفعل.‎ 
وحرف. مجرد جدا. ولا يفي بمعالجة خصوصیات الکلمات الوظيفية‎ 
ولذا وقع کثیر من الاضطراب ب4 تصنیف کثیر من‎ (YAN (غیوم.‎ 
الکلمات الوظيفية ضمن آحد هذه الاقسام ( لناقشة مستفيضة لهذه‎ 
السألة. انظر: الساقي. ۱۹۷۷). ورغم وجود عدد من الحاولات‎ 
الحديثة لوضع نماذج بديلة لتصنیف آقسام الکلام (للاطلاع على‎ 
ومن آبرزها محاولة تمام‎ i )۲۰۱۳ بعضها انظر: عاشور. ۲۰۰۵؛ کامل.‎ 


۳۳۵ 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
ود 


حسان (حسان, ۲۰۰۱) وتلميذه فاضل الساقي (۰)۱۹۷۷ إلا أنه لم 

(EY)‏ ومن الأمثلة المشهورة 4 الاستدراك على بعض التقريرات النحوية 
بناء على الاستقراء الاحصائي ما فعله عبدالخالق عضيمة 2 كتابه 
«دراسات لأسلوب القرآن» V hil)‏ مثلا: عیسی وعلي. ۰۹ <¥( 

)££( ومن الأمثلة البارزة على أدوات استجد لها استخدامات حديثة .2 
«العربية المعاصرة» كلمة lo‏ حيث أصبحت تستخدم كأداة ربط مقابلة 
لكلمة "any!‏ الانجليزية ولم تكن تستخدم بهذه الطريقة سابقا. ولکننا 
لم نتناول هذه المسألة 2 الدراسة الحالية لضيق المجال. 


المراجع 
المراجع العربية : 


أبو الهيجاء ياسين (۲۰۱۰) إشكالية تعريب الأسالیب ب4 قرارات لجنة 
الالفاظ والأساليب ‏ مجمع اللغة العربية بالقاهرة: الرابط نموذجاء المجلة 
الأردنية 2 اللغة العربية وآدابها. م (۰)7ع (۰)۱ ۰۱۲۰-۹۵ 

آبوحیان الاندلسي. محمد بن یوسف (۱۹۹۳) تفسیر البحر الحیط. 


تحقیق: Jale‏ آحمد عبدالوجود وعلي محمد معوض, بیروت: دار الکتب العلمية. 
بدوي» السعید محمد (۲۰۱۲) مستویات العربية العاصرة ب4 مصر: بحث 
.2 علاقة اللفة بالحضارة. القاهرة: دار السلام للطباعة والنشر والتوزیم. 
بشرء كمال )1455( اللفة العربية بين الوهم وسوء الفهم. القاهرة: دار 
غريب للطباعة والنشر والتوزیع. 


| FEWUCLLIEMT 


اضدا: من المركر o‏ 
Lä ja Le piia pug‏ — 3 
أو تداو لها تجاریا Wi‏ المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


البعليکي. منير (AAA)‏ الإعلام واللغة الاعلا میة. مجلة مجمع اللغة 
العربية. القاهرة. عدد (W)‏ ص ۰۲۶۶-۲۱۰ 

البلداوي» حسن جعفر (۱۲ (Y:‏ التعدية بالحروف 2 المعجم الوجيز»ء مجلة 
الأستاذ (كلية التربية. جامعة بغداد) .ع (YY)‏ ص .YM-Y00‏ 

بیلکین» ف. م (۱۹۷۳) 2 تاريخ تطور اللغة العربية الفصحی. ترجمة: جليل 

حسان» تمام (Y)‏ اللغة العربیة: معناها ومیناها. الدار الییضاء. دار 
الثقافة. 

حسن» عباس (avy)‏ النحو الوا 2. القاهرة: دار المعارف. 

حمادي» محمد ضاري (۱۹۰۸۱) حركة التصحیح اللغوي 2 العصر الحديث. 
بغداد: مطیوعات وزارة الاعلام والتقافة العر اقية. دار الرشيد. 

حمادي» محمد ضاري (yaaa)‏ التعدية بالحرف «علی» .2 تحقیقات 
اللغویین. مجلة المجمع العلمي العراقي, e GM e‏ (۲): ص ۱۰۲-۸۷ . 

الحمزاوي محمد رشاد (IAAT)‏ العربية والحداثة: أو الفصاحة فصاحات. 
بیروت: دار الغرب الإسلامي. 

الحمزاوي» محمد رشاد (۲۰۰۳) 2 لغة الصحافة وتعریب العلوم: قضاياهاء 
)01( یمکن الرجوع الیها من خلال الرابط التالي: http://www.arabization.‏ 
org.ma/hsearch.aspx‏ 

حوراني. البرت (41A)‏ الفكر العربي 2 عصر النهضة ۱۹۳۹-۱۷۹۸ء 
ترجمة: كريم عزقول. بيروت: دار اللهار للنشر. a AT)‏ 


۳۳۷ 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


خلف» e‏ عبدا لسلام (۲۰۱۱) التركيب الموسع 2 الفصحی العاصرة. 
المجلة العربية للعلوم الإنسانية (جامعة الکویت) » م (۰6۲۹ع .)١١١(‏ 

الربطة Jale‏ (۲۰۰۰) حروف العاني 2 الاستعمال الجاري: مثل من القديم 
والحدیث, رسالة ماجستیر غير مطبوعة. الجامعة الأردنية. 

الزعبي, آمنة صالح (۲۰۰۲) 2 تحول الاسالیب النحوية (التركيبية) .2 
اللغة العربية 2 العقدین السابقین على مرحلة العولة: لغة القصة القصيرة 2 
الأردن نموذ جاء مجلة جامعة دمشق, م (۰)۲۲ج (۱۱۶-۱۳۱۰)۲-۱. 

الساقي» فاضل مصطفی (۱۹۷۷) آقسام الکلام العربي من حیث الشکل 

السامرائي. ابراهیم (۱۹۷۲) تنمية اللفة العربية 2 العصر الحدیث. 

السامراتي ابراهیم (۱۹۹۵) 2 العربية المعاصرة ومعجمها. مجلة مجمع 
اللغة العربية. القاهرة. عدد (V)‏ ص ۰51-۷۸ 

السامرائي. إبراهيم (Y)‏ تصحيح «التصحیح». مجلة مجمع اللغة 
العربية. القاهرة. عدد (AV)‏ القسم الأول, ۰۱۶۲-۱۳۳ 

السامرائي. فاضل (۲۰۰۰) معاني النحو. عمان: دار الفکر للطباعة واللشر 
والتوزیع. 

السامرائي» فاضل (۲۰۰۷) معاني الأبنية 2 العربية. عمان: دار عمار 
للنشر والتوزیع. 

ستتکیفتش. جاروسلاف (۱۹۸۵) العربية الفصحی الحديثة: بحوث .2 
تطور الألفاظ والأساليب» القاهرة: دار النمر للطباعة. 


YYA 


شنه ۱ انار وق 
إخداء من A!‏ 5$ 
والايسمح بنشرضا ورقيا 
او تداو لیا تسا با 


Wi‏ المدونات اللفوية العربية 


تا nne‏ بناؤها وطراثق الإفادة منها 


(ابن) السراج محمد بن سهل )1441( الأصول 2 النحو (ط. (Y‏ تحقیق: 

السغرو شني. إدريس )1443( حول الاقتراض. ضمن: عبد القادر الفاسي 
الفهري (مح.). اللسانیات القارنة واللغات 2 الغرب. الرباط: كلية الاداب 
والعلوم الانسانية. 

سمبس» أميرة زيير )1 (aM YV/Y-‏ السمات اللغوية L‏ صحيفة آم القری 
2 ضوء اسهامها الاعلامی والاداري 2 الفترتين (۱۶۰۲/۵۱۶۷۲-۱۶۶۳- 
۳ ) مجلة جامعة al‏ القری لعلوم الشريعة واللفة العربية وآدابهاء ج (۰)۱۸ 
ع (YA)‏ ص ۰۳۷-۳۲۳ 

السوسوة عباس (Y**Y)‏ العربية الفصحی العاصرة وأصولها التراثيةء 
القاهرة: دار غريب. 

الشریف. محمد حسن )1443( معجم حروف العاني 2 القرآن الكريم: 
مفهوم شامل مع تحديد دلالة الأدوات؛ بيروت: مؤسسة الرسالة. 

الشیال. جمال الدین (۱۹۵۱) تاريخ الترجمة والحر aS‏ الثقافية 2 عصر 
محمد علي. القاهرة: دار الفکر. 

صالح, محمود اسماعیل (Y«1T)‏ الحاسوب والبحث اللغوي: الدونات 
اللفوية نموذجا. الریاض: جامعة الأميرة نورة بنت عبدالرحمن (منشورات 
كرسي بحث صحيفة الجزيرة للدراسات اللغوية الحديثة). 

الطناحي. محمود (۱۹۹۲) جموع التکسیر والعمرف اللغوي. مجلة مجمع 
اللغة العربية. القاهرة عدد (۰)۷۱ ص ۰۲۱۲-۱۳۹ 

gale‏ النصف (۲۰۰۵) دروس 2 آصول النظرية النحوية العربية من 
السمات إلى القولات أو لولبية الوسم الوضعي, تونس: مركز النشر الجامعي. 


۳۳۹ 


قند ۱ سار وق 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او نداو لها تحار پا 
ود 


عبدالعزيز» محمد حسن (۱۹۸۷) لغة الصحاقة العاصرة. القاهرة: دار 
ai bati‏ 


عبدالعزيز» محمد حسن (۱۹۹۸) خصائص العربية المعاصرة: مظاهرة 
حدائتها 2 الفردات والتراكيب: مجلة اللسان العربي: مکتب تنسیق التعریب. 
(t0) sac‏ یمکن الرجوع الیها من خلال الرابط التالي: http://www.‏ 
arabization.org.ma/hsearch.aspx‏ 

عبدالكريم» جمعان (۲۰۰۸) اللغة العربية الفصيحة المعاصرة: محاولة 
لقاربة المصطلح والفهوم. مجلة اللسان العربي. مكتب تنسيق التعریب عدد 
(11)» يمكن الرجوع الیها من خلال الرابط التالي: http://www.arabization.‏ 


org.ma/hsearch.aspx 

عصفورء محمد حسن (۲۰۰۶) تأثير الترجمة على اللغة العربية. مجلة 

العصيمي» صالح (۲۰۱۳) لسانيات المتون وعلوم اللفة. مجلة كلية الآداب 
والعلوم الإنسانية (جامعة سيدي محمد بن عبدالله. المغرب). ع )95( ص 
۷ 

عم أحمد مختار (۱۹۹۲) آخطاء اللفة العربية العاصرة عند الکتاب 
والإذاعيين (Y.L)‏ القاهرة: دار عالم الکتب. 

aas uer‏ مختار (Y**^)‏ معجم اللغة العربية العاصرة. القاهرة. عالم 
FE‏ 

عيسى» خير الدین؛ وعلي. عماد (۲۰۰۹) ردود عبدالخالق عضيمة 
على النحاة .2 كتابه «دراسات لأسلوب القرآن الکریم». مجلة جامعة كركوك 


۳۳۰ 


شنه العظيعة | 


إخداء من الرکز 0 
و pias Y‏ بنشرغا Lä ja‏ -— 8 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


غیوم. obe‏ باتريك )431( تكوين نظرية أقسام الكلام وبناؤها 2 العرف 
النحوي العربي. ترجمه: سام عمار. مجلة التعریب. عدد Y)‏ ص ۰۷۹-۱۱ 
(AAA)‏ 
العاصرة. مجلة مجمع اللغة العربية بدمشقء م (VA)‏ ج (é)‏ ص ۰۹۱-۸۹۵ 

فرستيغ» كيس (۲۰۰۳) اللغة العربية: تاریخها. ومستوياتهاء وتأثیراتها. 
ترجمة: محمد الشرقاويء القاهرة: المجلس الأعلى للثقافة. المشروع القومي 
للترجمة. )3453( 

فریمان أندرو (Y Y)‏ طبيعة اللغة العربية القديمة وتغيرها إلى العربية 
الوسيظة ومن ei‏ إلى العربية العاصرة. ترجمة: حمزة الزيني. ضمن كتاب 
«دراسات 2 تاريخ اللغة العربیة». الأردن, عمان: دار کنوز العرقة العلمية. 
)3450( 
۰۷-۵ ۲. 


القاعود. حلمي محمد (۲۰۰۸) تطور النثر العربي 2 العصر الحدیت. 
الریاض: دار النشر الدولي. 


القضماني. رضوان؛ عبدالقادن ميساء )£* (Y:‏ التولید اللغوي 2 العاجم 
(۱ ۱۵۲ (: 


۳۳۱ 


هذه الطيعة 
إخداء من الرکز 
ولايسمع بنشرها Led pg‏ 
او تداولها تسار با 
بود 


کامل. سلاف مصطفی (۲۰۱۳) أقسام الكلم 4# ضوء النظرية المعجمية 
الحديثة. مجلة الأستاذ (كلية التربية. جامعة بفداد)» عدد (YI)‏ ص 306- 
di‏ 

كنون» عبدالله (VAY)‏ الصحافة وتجديد اللفة. مجلة مجمع اللغة العربية 
القاهرة. ج )0( ص AYY-YYO‏ 

مجمع اللغة العربية (۱۹۸۳) 2 آصول اللغة (YL) Ye‏ القاهرة: الهيئة 
العامة لشؤون المطابع الأميرية. 

مجمع اللغة العربية (۱۹۸۹) القرارات المجمعية 2 الألفاظ والأساليب من 
۶ إلى ۱۹۸۷ء القاهرة: الهيئة العامة لشؤون المطابع الأميرية. 

مجمع اللغة العربية (۲۰۰۶) المعجم الوسيط (ط. ۶). القاهرة: مكتبة 
الشروق الدولية. 

المرادي» ا لحسن بن قاسم (۱۹۹۲) الجنى الدانى 2 حروف العانی. تحقيق: 
فخر الدین قباوة ومحمد ندیم فاضل. بیروت: دار الکتب العلمية. 

(ابن) منظور. محمد بن مكرم )1444( لسان العرب. تحقيق: أمين محمد 
عبد الوهاب ومحمد الصادق العبیدی. بيروت: دار احياء التراث العريى. 

نصار. algo‏ عبدالقادر؛ حماد» خليل عبدا لفتاح (Y:3£)‏ استعمالات لغوية 
معاصرة: دراسة 2 تأصیل الوضع اللفوي والتسویغ. مجلة جامعة فلسطین 
للابحاث والدراسات. ع )1( ص ۰۲۰۲-۲۸۳ 

الورهاني. بشیر (۲۰۰۸) الأفعال الناقلة 2 العربية العاصرة: بحث .2 


۳۳۲ 


شنه العظيعة 


اخداء صن المركر 0 
و prias‏ بنشرغا Lä ja‏ -— 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 

0 — بناؤها وطرائق الإفادة منها 
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XN 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


aiiai aia 
اخداء من الرکز‎ 
و لا بسمح بنشرها ورقيا‎ 
او تداو لیا تسا با‎ 
— — 8 15 


المبحث الخامس 


البحث اللغوي في المدونات العربية الحاسوبية 
بين الممكن والمحتمل والمأمول 


سلطان بن ناصر المجيول 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


alc‏ ار وق 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او نداو لها تحار پا 


تا — بناؤها وطرائق الإفادة منها 


دمهید 

لیس ثمة مناص من التداخل الاختصاصي interdisciplinary‏ بين الحقول 
اللسانية والعلوم الأخرى 2 الدواثر العرفية والعلمية بحثا وتحلیلا للسانيين 
والحاسوبیین والحللین للخطاب اللفوي. ومن آوجه هذا التداخل الاختصاصي: 
ولوج تقنیات الحاسب وبرمجیاته وأدواته التحليلية والعالجاتية 2 جمع النصوص 
2 مدونات محوسبة. وتصنینها وفق آوعیتها العلوماتية الناقلة. وفحصها تكرارًا 
وجمعًا وفرژا وتحلیلا من مکانزها الرقمية. ومن الهم البدء بأهمية البحث 
اللفوي الحاسوبي وقضایاه الاولية. والتي لا یمکن حصر كل مناهجه. غير أن 
abies‏ العامة تابا جه لقن یم ead‏ المخرل o‏ مزا desti‏ 
ویوظف عن طریقها خبرته اللغوية .2 آثناء معالجة قضية لغوية 2 الدونات 
الحاسويية الأحادية (انظر على سبیل التال. ميكنري وهاردي McEnery and‏ 
Hardie‏ ۲۰۱۲؛ Baker Sug‏ ۲۰۱۰) أو التقابلية ( جرانجر Granger‏ ۲۰۰۸؛ 
وجوهانسون Johansson‏ ۲۰۰۸) أو الترجمية ( جرانجر وآخرون Granger et‏ 
al‏ ۸ ) ومن المکن أن يقال إن ما سيقدم هنا هو ما پستحته واقع البحث 
اللغوي العربي الحاسوبي. وبمحاولة جديدة 2 الدراسات اللغویات الحاسوبية 
للملمة مناهج البحث اللغوي الحاسويي وعرضها بصورة موجزة لا تقتصر على 
التعریف والعرض فحسب. بل على فتح آبواب البحث اللفوي الحاسوبي التطبيقي 
بصورة لعلها توضح معالها للمختصین 2 اللفویات والدراسات اللفوية. وتعّف 
هذه الورقة بطرائق البحث اللفوي العربي الحاسوبي بصورة آولية ترسم 
تمرحلات التحلیل بواسطة العالجة الحاسويية بشکل مبسط؛ بدءا بالتعریف 
بأنواع الدونات الحاسويية للغة الطييعية .natural language‏ واتجاهاتها 
الممكنة والمحتملة والمأمولة. كل ذلك من أجل فحص العجم العربي الذهني 
التوليدي الواقعي الذي يتمثل -2 المدونات الحاسوبية والبحث اللغوي من حيث 


۳۳۷ 


Wi‏ المدونات اللغوية العربية 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
—— 


اتساع هذا المعجم أو تحجيمه باتساع المدونة أو تحجيمها (علاقة البحث اللغوي 
بتمثيل مدونة ما the representativeness of a particular corpus‏ للمستويات 
اللغوية العربية النموذجية). مرورًا بخصائص کل طريقة ومناهجها البحثية 
من حیث الفرض والتحلیل والعالجة, وصولا إلى افتراح يعض جن الوضوعات 
البحثية المهمة ظ هذا المجال. 


البحث اللغوي والمدونات العربية الحاسوبية 

تنال الدراسات اللغوية الحاسويية الغربية -وارهاصات هذا الدرس ف سياق 
اللغة العربية والحاسب والعالجة الآلية والبحث اللغوي القائم عليها- TW‏ 
من التداخلات الاختصاصية بالقدر الذي يحتاجه التطوير 2 طرائق البحث 
اللفوي العربي الحاسويي, وهنه التقاطعات هي على النحو التالي: آولا: هندسة 
اللغة :anguage engineering‏ ( استعمال آدوات التحلیل الحاسوبي لعالجة 
اللفة وهندستها من حيث عناصر بنائها وعلاقة هذه العناصر 2 علم الوجود 
(ontology‏ . ثانيًا: اللسانیات الحاسوبية computational linguistics‏ ومجاله 
الاختصاصي العروف بمعالجة اللغة الطبيعية natural language processing‏ 
:NLP‏ (طرائق تأسیس وبناء خوارزمیات وبرامج حاسويية تمیکن اللفة وتسمی 
بأدبيات متعددة ومعقدة ومتنوعة إلى محاولات تعریف الخصائص اللفوية 
اوا لضان SONUS NENNT ET‏ 
:corpus linguistics‏ بناء مدونات dugula‏ واجراء بحوث لسانية حاسوبية 
إحصائية تفيد مجال تقويم مصادر اللغة .Language Resources LRs‏ 
بالإضافة إلى التوسيم pall‏ 2 والنحوي والدلالي والإحالي وتحشية النصوص 
المكتوبة أو المنطوقة 2 قوائم حاسوبية تحليلية. وإعدادها لمرحلتي التدريب 
5 والاختبار :test‏ أي مرحلة الإعداد والتحشية والتوسيم (التدریب) . 
ومرحلة اختبار عمليات التوسيم على القوائم من أجل تحقيق نسبة مئوية تقل 


YYA 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


بازدياد عدد الكلمات 2 أي مدونة وتزيد بقلة عدد الكلمات 2 أي مدونة. رابعًا: 
تحليل النصوص الإلكترونية :electronic text analysis‏ ( جمع التصوص. 
والتنقیح, والعالجة, والاخراج ‏ قوائم حاسوبية من أجل التحليل لغرض معین: 
أوتضمينها 2 مواقع الویب. أو إدخالها 2 أقراص ممفنطة. إلخ). وسيّعرّف هذا 
البحث الاختصاصيين بالدرس اللساني الحديث على حقل لسانيات المدونات 
الحاسوبية corpus linguistics‏ أو علم المتون دون غيرها (انظر العصيمي 
۲۳ 4# مناقشة المقابلات العربية لمصطلح (corpus linguistics‏ . 

وثمة أسئلة عديدة سيجاب عنها من خلال هذه الورقة 2 الجملة. ومن أهمها: 
هل من الممكن أن تجيبنا المدونات عن كل أسئلة البحث اللغوي؟ وهل للبحث اللفوي 
المعتمد على المدونات شروط منهجية؟ وأي مدونة؟ ولماذا5 إن من أبرز المسارات 
البحثية التطبيقية للدرس اللساني الحاسوبي والتحليلي 2 المدونات الحاسوبية 
اللغوية التنوع الوصفي «synchronic variation‏ والتنوع الزمني diachronic‏ 
60 مومباحث التغير اللغوي الوصفي والزمني ضمن الجالات اللسانية 
التركيبية والدلالية. والتفیر اللغوي الوصفي 2 العربية العاصرة. وذ اك الزمني 
2 التاریخ التحليلي historiography‏ للغة العربية. 

وسیتطرق © هذا البحث إلى عدة موضوعات؛ آولها: الفرق بين الدرس 
اللساني العتمد على الدونة corpus-based‏ وذلك الوجه بالدونة corpus-‏ 
driven‏ وثانیها: آنواع الدونات الحاسوبية من حيث عدد اللغة فیها إلى أحادية 
اللغة monolingual‏ وتعددية اللغة multilingual‏ وتنقسم الأخيرة الى تقابلية 
comparable‏ )!153 : شاروف Sharoff‏ ۲۰۰۶؛ والمجيول al-Mujaiwel‏ ۲۰۱۲ ): 
ومتوازية parallellt o]‏ ( انظر العجمي al-Ajmi‏ ۲۰۰۳). وتالتها: الفرق بين 
الأدوات التحليلية للغة العربية ودورها .2 قراءة الرموز العربية المدعومة بالترمیز 
الخاص بإظهار نظامها الخطي. وما یتوافر فیها من آدوات بحث ومعالجة. 
ورابعها: علاقة بناء الدونة اللغوية العربية الحاسوبية ( آو آدوات معالجة اللفة 


۳۳۹ 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 
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العربية) بطرائق الافادة منها 2 البحث اللفوي. وخامسها: التصاحب اللغوي 
الفيرتي (نسبة إلى العالم فیرت. واضع نظرية التصاحب collocation theory‏ 
2 عام ۷ انظر فیرت Firth‏ ۱۹۵۷؛ وروحاني Rouhani‏ ۱۹۹۶) وتحلیل 
التتابعات اللفظية الباشرة. والتقارب الدلالي. والعلاقة بين الواد العجمية 
والقواعد اللغويةء والتفریق بين الدونة بوصفها نظرية والدونة بوصفها منهجا 
تطبیقیا . وتطویر سنکلیر Sinclair‏ (۲۰۰۶۰۱۹۹۱) لهذه الفاهیم بما یتوافر 2 
المعالجات الالية. وترسيخ جريس alat )۲۰ ۰ LYA YY) Gries‏ 
cas uai‏ قرعا Lato‏ من ید SUI‏ ا cds ls‏ وخ aao‏ انتاونه 
النحوي .colligation‏ ومن جهة التلازم المعجمي النحوي collostruction‏ 
والجموعات الدلالية semantic sets‏ کل هذا عن طریق آهم الرزم الإحصائية 
العمول بها 2 علم لغة الدونات (قارنها ب لسانیات الدونات الاحصائية ب «آر» 
statistical corpus linguistics with R‏ عند جريس Gries‏ ۰۱۲۰۰۹ ۲۰۱۰). آما 
آخرها فيتعلق بالمکن والحتمل والمأمول 2 الموضوعات الخمسة السابق ذكرهاء 
مع الحاق هذا الموضوع بجملة من الموضوعات البحثية المقترحة. 

۵ ١.البحث‏ اللغوي المعتمد على المدونة corpus-based‏ والموجه 

corpus-driven بالمدونك‎ 


ثمة منهجان آساسیان 2 البحث اللغوي ومادته النصوص الرقمية ( توجنيني 
بونيللي 2000 Tognini-Bonelli‏ ( . فالاول -كما 2 العنوان الفرعي- ينطلق 
من قضية لغوية محددة بافتراضات وفرضيات وأسئلة بحثية .2 ذهن 
الباحث اللغوي. ويقوم بتفسيرها وتحليلها بالاعتماد على النصوص الرقمية 
2 المدونة [57]. أما المنهج الآخر فهو النظر إلى المدونة وتدوين ما يمكن 
ملاحظته من مسائل لغوية صرفية وتركيبة ودلالية وسياقية. والتوجه من 
المدونة إلى صياغة فرضيات البحث وأسئلته. 


۳:۰ 


قند ۱ انار وق 
اخد!ا: من الرکز 
و aas‏ بنشرضا ور Led‏ 
او تداو لها تحار پا 


.Y.0‏ أنواع المدونات العربية الحاسوبية 


تتنوع الدونات اللغوية الحاسوبية بتنوع النوع. والغرض» والعدد. 
والتصمیم[۷؛]۰ والذي يهم 2 هذا السياق تلك الأنواع المتعلقة بالعدد. على 
الرغم من أهمية بقية الأنواع. وتعزى أهمية العدد إلى كونها الأكثر شمولية 
لمستويات اللغة؛ بخلاف النوع والغرض اللذين تنحسر أبحاثهما على مستويات 
لغوية محددة. وأجناس كتابية معينة. وبخلاف التصميم الذي ينحصر اهتمامه 
على مجال تطوير تصميم المدونة ومعالجتها من حيث أنواع التوسيم والتحشية. 
ولا يعني هذا التصنيف عدم وجود مدونة حاسوبية عربية تتنوع 4 النوع والغرض 
والتصمیم. فالمدونة اللغوية العربية لمدينة الملك عبدالعزيز للعلوم والتقنية 
King Abdulaziz City for Sciences and Technology's Arabic Corpus‏ 
((KACSTAC‏ قد تطورت 2 نسختها الجديدة ) مختلفة عن النسخة القديمة 
41717115351228 انظر الثبيتي al-Thubaity‏ ۲۰۱۶) من حيث توفر 
خصائص بحثية دقيقة للکشافات السياقية والتكرارات والتتابعات والتي ستمكن 
من تحديد أسئلة وفرضيات لغوية أكثر دقة إن أحسن الباحث استعمالها. وعلى 
صعيد آنواع المدونات العربية من حيث العدد. فالنوع الأول يتضمن نصوص اللغة 
العربية المكتوبة والمنطوقة أو أحدهماء والمّدخلة حاسوبيًا مع توفر محرك بحث 
search engine‏ شبكي فيها من أجل البحث عن كلمة محددة # النصوص المدخلة 
فيها حاسوبياء وامكانية إظهار عدد مرات تكرارهاء واتاحة إخراج كشافاتها 
السياقية. كله من أجل كشف السلوك البيئي السياقي اللغوي الطبيعي لتلك الكلمة 
وما يرد قبلها وبعدها من وحدات معجمية نظمية syntagmatic lexical units‏ 
(dia‏ بمصطلح ( ciis Lll)‏ اللفظية (collocations‏ . والنوع الثاني يتضمن 
مدونتين منفصلتین؛ الأولى: عربية؛ والثانية: لغة غير العربية» ویعمل على جمعها 
معًا وفق عدة معايير هي على النحو الآتي: تقابل الأوعية genres‏ والمجالات 
95 من حيث النوع والحجم. وتوافق أزمنة إنتاج النصوص الحية 2 كلتا 


Wi‏ المدونات اللفوية العربية 
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هذه الطيعة 
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ولايسمح بنشرها ورقيا 
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اللغتین. وتقارب خیارات محرك البحث فیها ( انظر ميكنري 2003 :McEnery‏ 
۰ ميكنري وشیاو 2007 :McEnery and Xiao‏ ۲۰). آما النوع الثالث من 
حيث العدد. فيُعرف بالدونة التوازية parallel corpus‏ وهذا النوع من الدونات 
ما زال 2 بداية انطلاقته بين العربية والإنجليزية (انظر العجمي al-Ajmi‏ 
۳ وانظر حول بداية معالجة المدونة المتوازية 2: بياو Piao‏ ١٠٠5ل‏ ۲۰۰۲. 
وبيكر وآخرين ٩ :۲۰۰ Baker et al‏ فيما يتعلق بطريقة معالجة المحاذاة آليا). 
والفرق بين المدونة اللغوية الحاسوبية المتقابلة وتلك الوازية تکمن ب4 أن نصوص 
المدونة الأولى من اللغتين لا تكون نتيجة لعمل ترجمي مسبّقاء بينما -2 نصوص 
الثانية يكون توازي النصوص مشروطا بناتج الترجمة الفعلية الواقعية؛ وتُدخَّل 
هذه النصوص UT‏ 2 قوائم تمثل كل مدخل تركيبي أو معجمي من اللغة المترجم 
منها إلى ذلك المدخل التركيبي والعجمي ‏ اللغة المترجم إليهاء والذي یعرف 
بالمحاذاة الآلية automatic alignment‏ بين نصوص اللغة المصدر وترجماتها 
ك اللغة الهدف[۸]. 


وبالنسبة للمدونات العربية الحاسوبية. يرى الباحث أن آکبر الدونات 
العربية الأحادية -كما أشير إلى ذلك سابقا- تتمثل 2 المدونة اللغوية العربية 
لمدينة الملك عبد العزيز للعلوم والتقنية »۰16051۸ ومدونات العربية الشبكية 
Arabic Internet Corpora‏ ومدونة أرابيكوربوس -arabiCorpus[£4]‏ ویتوفر 
2 هذه المدونات محرك استعلام query engine‏ شبكي يقوم من خلاله الباحث 
بكتابة كلمة ما والبحث عن استعمالاتها 2 النصوص العربية المحوسبة. وثمة 
ك المقابل أدوات آخری لمعالجة النصوص العربية الرقمية. ومختلفة عن تلك 
المتضمنة 4 الدونات الثلاث المذكورة آنقاء وهي أدوات برمجية مستقلة عن 
المدعومة .2 مواقع تلك المدونات الثلاث. حيث تقوم بمعالجة النصوص العربية 
المحفوظة 2 امتدادات عديدة على غرار text‏ و (csv‏ و xml‏ و rtf‏ وغيرها. 
ومن أهمها قبولا للتطبيق التحليلي 2 أكثر الأدوات ذکاء حتى الآن (غواص 


شنه ۱ انار وق 
اضداء من الرکز 
و aas‏ بنشرها ور Led‏ 
او نداو لها تحار پا 


ACL‏ آولا ثم سکتش إنجن (Sketch Engine‏ ویری النظر 2 آدوات معالجة 
العربية من أجل القارنة بینها من حيث التصمیم. والاتاحية. وقابلية القراءة 
للنصوص العربية. ونظام الاستعلام. ومؤشرات التصاحب. والنتائج الا حصائية 
ومقارناتها. وهي محور موضوع البحث الاتي. 

۵ . أدوات معالجة اللصوص العربية 


تنقسم آدوات معالجة نصوص العربية إلى قسمین. آولهما: برامج تطبيقية 
حاسوبية حيث توفر للباحتین إمكانية تحمیل نصوص عربية على امتداد ملف 
text‏ أو امتداد ما یسمی بالقیم الفصولة بفواصل comma separated value‏ 
۷ والتي تحول آليا ‏ برنامج إكسلء وتوفر أيضا إمكانية البحث عن الكلمة 
العربية. شريطة أن تكون هذه الأدوات المخصصة لمعالجة اللغة العربية مبرمجة 
مسبقا من أجل دعم فك شفرات أشكال الكتابة العربية الاملائية بالترميز 
العربي الحاسوبي إلى أشكاله الكتابية الإملائية. أي: تكون مدعومة بأحد 
الترميزات الآتية: UTF-8‏ أو UTF-16‏ ( الثبيتي وآخرون al-Thubaity et al‏ 
3). . ومن أنواع هذه الأدوات الداعمة لقراءة النصوص العربية: مونوكونك 
MonoConc[o:]‏ والفهرسة الاستدراكية وأسلوب بناء الاسترجاع بلغة 
التوصيف الموسعة XML Aware Indexing and Retrieval Architecture‏ 
Xaira[o]‏ والكلمة الدالة 2 السياق KWIC (keyword in context) [0Y]‏ 
وأكونكورد aConCorde[oY]‏ وأدوات وورد & WordSmith Tools[oi]‏ 
وغواص .GhawwLDIDI[oo]‏ ويتطلب من الباحث اللغوي عند استعمال هذه 
الأدوات برنامج الجافا Java‏ من أجل تشغيل هذه الأدوات. أما ثانيهما: فهي 
أداة متوافرة على الشبكة العنکيوتية. ERT‏ باسم Sketch Engine[o*]‏ وتعد 
أداة معالجة للنصوص اللغوية (ومنها العربية) (تحدث الثبيتي عن بعض هذه 
الأدوات 2 المبحث الثالث من هذا الكتاب). 


۳:۳ 
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ویتیح هذان النوعان من الأدوات نظام الاستعلام النصي عن الكلمات 
والعبارات وتكراراتها Frequencies‏ 2 النصوص العربية واستخراج کشافاتها 
السياقية concordance lines‏ وكل أداة من هذه الأدوات تختلف عن الأخرى 
من حيث ما تتيحه من أنظمة استعلامية «query systems‏ آي آن کل أداة من 
cal loa‏ تتضمن آنظمة تمکن الستخدم من تحديد النتاگج الطلوب اظهارها 
ضمن قوائم على شاشة الحاسب. وتتوافق هذه الأدوات 2 بعضها. وتختلف 2 
بعضها الآخرء وتتمیز بعضها بأنظمة جديدة ليست متوفرة 2 الأخريات (انظر 


| لجدول x ( YA‏ 
الأدوات WordSmith | aConCorde | KWIC Xiara Mono‏ غواص Sketch Engine‏ 
Tools Conc‏ 
REN‏ مايكل بارلو | BNC‏ ساتورا | آندروروبرتس | مايك سكوت | الثبيتي وآخرون Lexical‏ 
Michael‏ تسوكاموتو | Computing Mike Scott | Andrew‏ 
Ltd. Roberts Satoru Barlow‏ 
Tsukamoto‏ 
الإتاحية متاح بالشراء | متاح 4ك | متاح بالجان | متاح بالمجان | متاح بالاشتراك | متاح بالمجان متاح لتجريب 
موقع مليون كلمة؛ ثم 
BNC‏ بالاشتراك 
قابلية القراء2 ترتیب الترتيب ad yl‏ الترتيب دقيق الترتیب دقية الترتيب دقيق الترتيب دقيق 
الآلية الکلمات 2 دقیق دقیق 
Machine-‏ | الجملة ليس 
Readability‏ | ;242 
نتائج البحث 
عن كلمة 
نظام متوفر بدون دقیق متوفر بدون | متوفر ويتيح متوفر بدون متوفر مع متوفر مع خيارات 
الاستعلام خیارات ویحتاج خیارات البحث عن | خیارات متقدمة خیارات متقدمة باستعمال 
Query‏ متقدمة لسرعة متقدمة | الكلمة الفتاح. متقدمة: 0 بالرمز 
system‏ عالية أو العبارة. استعمال )*( ونظام 
ويتطلب أو باستعمال wildcard‏ استعمال phrase‏ 
الكثير من wildcard‏ وإمكانية و Corpus Query‏ 
الوقت بالرمزين (*) تنقیح النص Language‏ 
أو(ة) من الهمزة 
والتاء المربوطة 
والأرقام 
والرمز 
الاجنبية 
وغيرها 


٤ 


| aula هلد‎ 


اخداء من mu 5$ A!‏ 
ولايسمح بنشرضا ورقيا s‏ 8 
أو تداولها تساريا المدونات اللغوية العربية 
د بناؤها وطرائق الإفادة منها 


موشرات توفرة غير متوفرة | متوفرة بدون | متوفرة بدون | متوفرة ودقيقة متوفرة. OS‏ 
التصاحب قة دقة دقة مع تحديد مع عدم إمكانية 
Collocation‏ مواقع امتداد | تحديد مواقع 
indicators‏ التصاحب الی | امتداد التصاحب 
مدى ۱۵ كلمة 
الرّزمة مدعومة ب غير مدعومة مدعومة ب: مدعومة مدعومة بالرزم 
الإحصائية Chi-Square Mutual‏ | بالرزم الآتية الآتية 
الخاصة t-score Chi-Square | Likelihood Infor-‏ 
بالمدونة mation‏ و Mutual Weird logDice‏ 
Information | Coefficients z-score Corpus-‏ 
logDice Mutual Based‏ 
Information Statistics‏ 
Likelihood Package‏ 
t-score‏ 
z-score‏ 
LogDice‏ 


الجدول (Y1)‏ آدوات معالجة نصوص اللغة العربية وخصائصها 

بالنظر إلى هذا الجدول, نلحظ أن الإتاحية وقابلية القراءة تبدو واضحة, 
الكلي والجزئي ونوع الكلمة) ؛ فالادوات ۱۷۲0۵00006 و .KWIC‏ و WordSmith‏ 
Y Tools‏ تتضمن امكانية البحث بطريقة المطابقة الجزئية باستعمال خاصية 
wildcard‏ أي: باستعمال الرمز (*) أو الرمز (5). ونجد هذه الخاصية .2 
الآداتين غواص و sis «Sketch Engine‏ هذه الخاصية البحث عن التطايق 
الجزئي» فعلى سبيل المثال: لو آدخلنا (حکم*) فان نتائج البحث ستظهر جميع 
المتطابقات للكمة التي تبتدئّ بالجذر (حکم) وجميع وحداتها الصرفيمية 
السابقة المقيدة بهاء ومن أمثلة النتائج: آحکم/ استحكم/ الحکم/ آراحکم/ الخ. 
(الکلمة: أراحكم ليست من جذر /ح/2/۰/۵/۰/ الا أن طريقة المعالجة بالرمز 
x‏ تظهر أي تطابق جزئي شكلي). أما لو أدخلنا (*حكم) فان نتائج البحث 
ستظهر جميع المتطابقات الجزئية للجذر نفسه مع جميع وحداتها الصرفيمية 


fo 


هذه العظبعة 
إخداء من المركر 
ولايسمح بنشرغا ور قیا 
او تداولها تسار با 
) ب ——— 


اللاحقة المقيدة بهاء ومن آمثلة النتائج: حكمة/ حكمك/ حكمنا/ حكمهم/ 
إلخ. (انظر إلى الأرقام ۰۱ و۲. ولاء و۸ 2 واجهة غواصء والأرقام ۳. و؛. وه 
۰ 2 واجهة Sketch Engine‏ .2 الشکل ۱۶) ويرى هنا أن خاصية الحرف 
البدیل wildcard character‏ لا تضمن استخراج التطابقات للوحد ات الصرفية 
المقيدة الداخلة. فكلمة (استحکام) Wia‏ تحتاج إلى أن يبحث عنها لوحدها. 
وکذا الحال لكل كلمة اشتقاقية طابعها اللسقي الصرفيمي غير سلسلي NON-‏ 
6 (ر(انظر إلى الأرقام ۱ و و .2 الشکل ۱۶). وما 
يلفت الانتباه 2 هذا السیاق هو أن أداة KWIC Concordance‏ برغم عدم 
توفر هذا الخاصية فیها. الا أنه بمجرد كتابة الجذر (حکم) 2 خیار KWIC‏ 
فان جمیع النتائج تتضمن متطابقات هذه الكلمة الكلية والجزئية ذات النسق 
الصرظ السلسلي فقط ( انظر إلى الرقمین ۱۵ و١١‏ الشکل .)١‏ آما الرمز الثاني 
)8( التعلق بخاصية wildcard‏ فان وضعه قبل الكلمة الراد البحث عنها أو 
بعدها يعين على استخراج تطابقات هذه الكلمة الجزئية باظهار حرف واحد 
فقط. على سبیل الثال: (حکم؟) = حکمة/حکمت/حکمك/ الخ. و([*حکم) = 
آحکم /یحکم/نحکم / الخ. 
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هده الظبعة 
إخداء من المركر 
ولا يسمع بنشرها lus‏ 
او تداو لها Lr dum‏ 
—| — تسا 


.١‏ محرك البحث ب (حکم*)  ٠2‏ خواص تنقيح المفردات 2 غواص .٠‏ محرك البحث ب (حكم*) 
۲. نتائج البحث ل (حكه*) I‏ خواص إضافية (قوائم .٠١‏ نتائج البحث ل (حکم«) 
؟. محرك البحث ب (حكم*) الإيقاف (المستثناة) والشمول) gil. VY‏ البحث ل (استعکام) 
4. نتائج البحث ل (حکم*) psat aay‏ 

۸ نتائج البحث ل (حکم*) 


"١.نتائج‏ البحث ل (استحکام) 


WI‏ المدونات اللفوية العربية 
بناؤها وطرائق الإفادة منها 


Y Y‏ نتائج البحث ل (استحكام) 


۶ نتائج البحث ل (استحكام) 
۵. نافذة جديدة للبحث 


۲ نتائج البحث للجذر (حکم) 


الشکل ۱۶: واجهة غواص KWIC Concordance; Sketch Engine;‏ ونتائج بحث 


كلمة (حکم) 


آما مؤشرات التصاحب collocational indicators‏ فهى عملية معقدة. 


ویرمز لها ب N-gram‏ وتشیر إلى التتابعات اللفظية السابقة أو اللاحقةء 
والتي تمتد من ۱ إلى ۰۱۵ وتنطلق من المادة العنقودية Nodal item‏ التي يُبحث 
عنها 2 الأصل بوساطة آدوات التحلیل المذكورة آنفا (انظر: ۰۲ ۰.۵ وتظهر 
التصاحبات ( أو التتابعات) اللفظية للمادة العنقودية على شکل کشافات سياقية 


concordance lines‏ ( الشکل ۱۵ وحساب التوافق لكلمة معجم 2 مدونة فرعية 


للمعاجم العربية (ArabicLexicon6‏ . 


۳:۷ 


والايسمح بنشرها ورقيا 
او تداولیا تجاريا 
n—— —‏ 
(” خبارات 
عدد الکلمات السایقة: |5 ب عدد الکلمات اللاحقة: 5 ۱۷ الترتیب حسب: الملف a hd‏ التکرار: .۰ 1111 
j‏ ات | 
^ جدول البياتات 


dii 11‏ معجم 

ArabicLexiconê.tt ۰ 6‏ حصن الارسانا في معحد تاج 
ArabicLexicon6.bt ۰ ۵‏ بعد کأنها كلمه: هي في معجم البلذان: ب "T‏ 
ArabicLexicon6.bt ۰ 6‏ في ج: متون: بالتاء. وفی — S‏ جتوب. زانت ج: ممدود. 
ArabicLexiconG.bt ۰ 8‏ الشاعر. وإليها تندب الشائیه. فى = البلدان لیاقوت: خبراتها في موضع 
ArabicLexicon&.bt ^‏ إباد كذا في ج. وفی — یاقوت: واد بالائیل من أعراض 
ArabicLexicon6.bt ۰۰ 8‏ حکبم. والتصویب عن قء وعن معجم التعراء قال ص المليح بن 

۲ 056 لع ۰ ۰ ArabicLexicon&.bt‏ إلى الحزيز حريز محارب. فى معجم البلدان: في ديار بنى سليم. 


| نس سس 


الشکل (۱۵) الکشافات السياقية للكلمة الأساس (معجم ) بامتداد 0 متتابعات لفظية سابقة ولاحقة 


ویّری أن حساب توافق الكلمة النوعية type‏ والكلمة الفعلية token‏ تختاف 
بين غواص Sketch Engines‏ فالأول يختلف عن الثاني .4 الحساب» ولزامًا 
على الباحث أن يدرك سبب الاختلاف. والعائد إلى دقة غواص .2 تحليل 
مفهومي الكلمة النوعية والكلمة الفعلية والمسافات بينهما التي عادة ما تكون 
محشوة بعلامات الترقیم. وعليه لو وضعنا مدونة عربية 2 صيغة text‏ وقمنا 
بتحميلها 2 أداة غواص والأداة الشبكية Sketch Engine‏ فان حساب التطابق 
2 الثاني سيكون أعلى نظرًا لاعتباره المسافات المملوءة بعلامات الترقيم 
وغيرها من الرموز. (Slo‏ يتميز Sketch Engine‏ بإمكانية معالجة النصوص 
العربية التوفرة على المواقع الشبكية من خلال خاصية WebBootCat‏ (انظر 
http://www.sketchengine.co.uk/documentation/wiki/Website/‏ 


. (Features WebBootCat 


۳:۸ 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


والرزم الإحصائية الخاصة بالمدونة مجموعة من القياسات الإحصائية 
statistical measurements‏ التي تقدم دلالات رقمية يكون منها القبول وعدم 
القبول ‏ قياس قوة الارتباط بين الكلمات المتصاحبة (كلمة بصحبة كلمة) أو 
المتجاورة (كلمة بجوار كلمة يفصل بينهما كلمة أو كلمتين أو أكثر). ويّرى هنا 
تلخيص وظائف آهم هذه الإحصاءات المتعلقة بالتحليل الآلي للنصوص العربية, 
والتي تفيد الباحث اللغوي بالدرجة الأولىء وهي على النحو الآتي: 

Chi- ومن آهمها: مربع كاي‎ i ما يتعلق بالتحليل بين مجلدين (مدونتین)‎ Si 
تفيد -2 قياس توزيع تكرارات النصوص أو الكلمات بين‎ eu (Square (x2 
مع التكرارات‎ observed frequencies مجلدين بحساب التكرارات الملحوظة‎ 
من الأولى) من‎ Ti (والأخيرة تستخلص‎ expected frequencies المتوقعة‎ 
وأداة غواص تقوم بحساب‎ .null hypothesis أجل دعم الفرضية الصفرية‎ 
مربع كاي بشكل آليء ولا يفضل استعماله لعرفة قياس تكرار الكلمات 2 المجلد‎ 
هنا: كيف يمكن للباحث اللفوي الذي سيحلل نصا‎ mall الواحد. والسؤال‎ 
أن يستفيد من قراءة الارقام‎ Sketch Engine رقمیا باستعمال أداة غواص أو‎ 
الاحصائية التي تقدمها هاتان الاداتان فیما یتعلق بهذا القیاس؟ وکیف لهما‎ 
أن تدعما أو ترفضا الفرضية الصفرية التي یصوغها الباحث؟ عند مقارنة‎ 
إلى تکرارات كلمة ماء‎ JÈU مدونتین (مجموعتین) من حيث النظر. على سبیل‎ 
محددة فانها لن تتوافق‎ null hypothesis فانه كلما كانت الفرضية الصفرية‎ 
الا بطبيعة الدونة الحللة. والدخلة 2 آدوات التحلیل. بمعنی آخر: لوقمنا بجمع‎ 
معجمّا). واستخلصنا فرضية‎ YE) نصوص العاجم العربية كلها قدیما وحدیثا‎ 
أكثر‎ inflectional suffixes لغوية صفرية مفادها: أن اللواصق التصريفية‎ 
فيها بخلاف مدونة الصحف‎ derivational suffixes من اللواصق الاشتقاقية‎ 
السعودية حیث اللواصق الاشتقاقية فیها آکثر من اللواصق التصريفية. فإن‎ 
العينة هنا يجب أن تتوافق مع آرکان الفرضية الصفرية. وهي أن الفروق بين‎ 


۳:۹ 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


asia‏ انار وق 
اهداء من المركز 
واللايسمح بنشرضا IT‏ 
او تداوليا تجاريا 
î‏ 


هذين النوعين من اللواصق واقعٌ طبيعيًا بين المدونتين بمحض الصدفة: وان لم 
يكن وقوعهما بمحض الصدفة ola. bê chance‏ ذلك يعني أن الفرضية لا يُمكن 
قبولها . ولكن كيف يُمكن قراءة الأرقام التعلقة بهذا القياس؟ كلما اختلف حجم 
كل من المجموعتين JS)‏ مجموعة تتضمن Ula‏ لنصوص رقمية عربية): اختلفت 
القياسات المتعاقة بمريع كاي؛ وعلیه تختلف الفرضية الصفرية التي تدعم بقيمة 
کل من التكرارات الملحوظة observed‏ الواقعية والتكرارات المتوقعة expected‏ 
والتي ۱ بشكل T gl‏ لعطیات العادلة الاتیة: O)‏ 2/۳( ۳-۵ وحساب 
هذه العادلة ببساطة هو استخلاص نتيجة التکرار التوقع expected frequency‏ 
عن طریق جمع معطیات التکرارات اللحوظة (الواقعية فعليًا) من کل مجلد 
مستقل. واستخلاص نتائج جمعها عمودیا وأفقیا (الجدول ۳۷). 


تکرار اللواصق الاشتقاقية | تکرار اللواصق التصريفية 
للفعل (ذهب) اللحوظة للفعل (ذهب) اللحوظة 


الجدول (YY)‏ الرحلة الأولى لطريقة حساب التکرارات التوقعة 
ف الترحلة الشانیة. تضرب کل قیمة لجموع کل من التکرارات اللحوظة, 
ثم تقسم على مجموع نتائج التکرارات العمودية والأفقیة: 7.8 —)18*17/(39 
و10.1 -)18*22/(39. و9.1 -)21*17/(39. و11.8 -(21*22/)39 (الجدول 
. 
ثم تقسم نواتج هذه القيم باستعمال العادلة الآتية: (O-E)2/E‏ من أجل 
استخلاص أربع قيم (انظر الخانات المضللة 2 الجدول (YA‏ ثم تجمع هذه 


Yo: 


هذه الطبعة | 


إضداء من المركز 2 
ولايسسع بنشوغا Lā ja‏ : : 
أو تداو نها تجاريا © المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


القيم لاستخلاص مربع كاي بشكل نهائي (مجموع حاصل O-E)2/E)‏ من كل 
خانة: 1.51 0.41540.3964-0.39640.303-2 مربع كاي). 


تكرار اللواصق | تكرار اللواصق تكرار اللواصق 
الاشتقاقية للقمل | التصريفية لفعل | الاشتفاقية لاغعل 
(ذهب) اللحوظة | (ذهب) الملحوظة 0 | (ذهب) التوقعة ۲ 


الجدول (YA)‏ التکرارات اللحوظة observed frequencies‏ الفعلية والتکرارات التوقعة 


expected frequencies‏ الالية 


(O-E)2/E 


الجدول (Y^)‏ القيم المحسوبة calculated values‏ للتكرارات الملحوظة والمتوقعة 

هذه القيمة الحسوبة calculated value‏ تعد Jl‏ من القيمة الواقعية critical‏ 
8 آي عدد الأسطر والأعمدة من المتغيرات 4 حساب مربع كاي # المربع 
2 الجدول (YA)‏ وهنا فان كل عملية حسابية للمتغيرات ( أو ما تصطلح عليه 


اه" 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداولهيا تسا با 


باسم درجة التکرار degree of frequency‏ . والذي یمثل قيمة Y‏ 2# المثال المذكور 
آنفا؛ آي: الخانة الأفقية الاولی الخاصة بالفرضية مع خانتي القیم الافقية 
للمدونتین كما هو 2 الجدول (YA‏ تتضمن القيمة الحسوبة والقيمة الواقعية, 
وكل فرضية لفوية تحسب بوساطة مربع كاي تکون نتائجها وفق معیارین؛ الأول: 
Jab‏ الفرضية اللفوية الصفرية null linguistic hypothesis‏ عندما تکون 
القيمة المحسوبة calculated value‏ أعلى من ۰,۰۵ والثاني: du‏ الفرضية 
اللغوية الصفرية عندما تكون القيمة المحسوبة آقل من ۰۰,۰۵ وعليه فإن القيمة 
النهائية لمربع كاي ۱,۵۱ تعد أعلى من القيم ذات الدلالات الاحصائية: ۰۵, ۰. 
أو ۰,۰۱ أو ۰,۰۰۱ وعليه إن الفرضية التي Lalab‏ (اللواصق الاشتقاقية 
والتصريفية ‏ الدونتبن مختلفة) غير صحيحة. 

ثانیا: فیما یتعلق بتحلیل الكلمة البحوث عنها ومتصاحباتها (الكلية السابقة 
أو اللا حقة مباشرة) أو متجاوراتها (الكلمة السابقة أو اللاحقة غير الباشرة؛ 
آي: 4 الوضع الثاني أو الثالث أو الرابع أو الخامس). ومن eal‏ الاحصاءات 
التي تفيد دلالة التصاحب هنا هي: المعلومات المتبادلة Mutual Information‏ 
(MD‏ وقياس-ت |T-Score‏ وقياس-ز :Z-Score‏ ومعامل دايس Dice‏ واللوج 


.logDice دايس‎ 


فالمعلومات التبادلة قد وضحها تشرتش وهانکز Church and Hanks‏ 
(۱۹۹۰) وآواکس Oakes‏ )1444( على آنها تفید بالکشف عن احتمالات تکرار 
وقوع کلمتین یکونان متصاحبین مفا مرة. ووقوعهما منفصلتین. ومعادلة هذه 
الا حصائية log2((PG;y)/P(x)P(y)): re‏ حيث إن P‏ هو عدد تکرار الكلمةء 
أما × و y‏ فهما المتصاحبان اللذان يراد اختبارهما. ولو قمنا على سبيل المثال 
باختبار تكرار كلمة (عاصفة أو عاصف) مع الصفتين (شديدة) و(قاشرة). 
فإن المعطيات الإحصائية ستكون على النحو الآتي: عدد كلمات مدونة المعاجم 
العربية ۲۰,۶۳۲,۲۱۲ كلمةء وعدد تكرار كلمة (عاصفة أو عاصف) فيها ۱۲۰ 


YoY 
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اضدا: من المركر o‏ 
و Y‏ یسمع بنشرغا Lä ja‏ -— 8 
أو تداولها تجاريا W‏ المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


مرة. وعدد تكرار (عاصفة قاشرة) > مرات. وعدد تكرار (عاصفة شدیدة) 
۵ مرات. وعدد تكرار الصفة (قاشرة) لوحدها ۱۲ مرة. وعدد تكرار الصفة 
(شدیدة) لوحدها ۱۵۱٩‏ مرة. ولقیاس کل متصاحب collocate‏ من الصفتین 
(آي: شديدة وقاشرة) على حدة مع الادة العنقودية nodal item‏ (آي: عاصفة 
أو عاصف) . فإن العادلة تتمثل على النحو الاتي: 

آولا: معادلة العلومات التبادلة للتصاحب «عاصفة أو caule‏ شديدة» 
وناتجهما هي: 

log2((5 * 20,432,212)/(120 * 1519))- 3 

ثانيًا: معادلة المعلومات المتبادلة للتصاحب «عاصف أو عاصفة قاشرة» 
وناتجهما هي: 

1082 ))4 * 20,432,212(/)120 * 12))= 15.7 

بنتائج كل معادلة. نلحظ أن قوة التصاحب بين المادة العنقودية والصفة 
(قاشرة) أعلى من تلك الواقعة بينها والصفة (شديدة)؛ وقوة التصاحب هنا 
يشير إلى أن التزام الصفة الأولى أكثر دلالة من حيث الاستعمال المنسجم من 
الصفة الثانية. وفيما يتعلق بدلالات العلومات التبادلة إحصائياء فإن الناتج 
الذي يكون أعلى من ۰۳ يكون مقبولا من حيث الدلالة الإحصائيةء وان كان أقل 
فان دلالة التصاحب تكون حينها غير مقبولة. 

وقياس-ت t-score‏ یتشابه مع العلومات التبادلة غير أنه یقوم باظهار 
مقاییس التشتت لاحتمالات تکرارات التطابق للمادة العنقودية nodal item‏ 
ومصاحبها collocate‏ بالاستناد إلى عدد الکلمات 2 الدی الواردتین فيه 
(سکوت Scott‏ ۰۲۰۱۰ وانظر هانستون Hunston‏ ۰۲۰۰۱ ۲۰۰۲؛ وبرایس Price‏ 
۳ ویتکون هذا القياس من المعادلة الآتية: (x/n)-x)/Vj‏ حيث nol‏ يعبر عن 
العدد الكلي للكلمات 2 الدونة. و j‏ يعبر عن حاصل ضرب التكرار المشترك بين 


YoY 


قند ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرضا ور Led‏ 
او نداو لها تحار پا 
ود 


المادة العنقودية ومصاحيتها؛ حيث X ol‏ يشير ببساطة إلى F1*F2‏ (أي: ضرب 
عدد تكرار الكلمة الأولى مع عدد تكرار الكلمة الثانية المصاحبة للكلمة الأولى) . 
ویستفاد من هذه العملية ب4 تحليل الكلمات ذات المعاني المتعددة .polysems‏ 
والناتج الآلي الذي يستخرج بهذه المعادلة يجب أن يكون من ۲ فما قوق من أجل 
ضمان قياس | حصائي ذي دلالة قوية. 

آما قیاس-ز .z-score‏ فقد شرحه بيري-روجي Berry-Rogghe‏ (۱۹۷۳: 
۱ بالعادلة الاتية: 

IZ‏ العدد الكلي تلکلمات 2 المدونة 

4: المادة العنقودية وعدد مرات تکراراها 

:B‏ الصاحب للمادة العنقودية وعدد مرات تکرارها 

> عدد مرات تکرار A‏ و 8 معا 

5: الدی وعدد الوحدات العجمية قبل المادة العنقودية ویعدها 

تقوم الأداة الدعومة بهذه الرزمة الاحصائية باستخراج قيمة Z-score‏ 
بين الادة العنقودية والتصاحب LÍ‏ كان موقعه (مدی خمس کلمات5-70۳1 
(span‏ » وكل متصاحب لفظي مع المادة العنقودية تكون قيمته أعلى من das‏ 
S‏ تفا یشک مشو 
6 ( کیلجارف وآخرون2004 Kilgariff et al‏ ( ؛ وأساس معادلته هو 2fAB/‏ 
eu ((fA--fB‏ إن fAB‏ يدل على تكرار الوحدة المعجمية الهدف مع المتصاحب 
المعني بالتحلیل. و 14+8 يدل على حاصل جمع تكرار المادة العنقودية لوحدها 
مع تكرار المتصاحب المعني بالتحليل. ومشكلة هذا القياس هو أنه يقدم قيمًا 
صغيرة جدًا (أقل من ۰,۰). L‏ معامل اللوج دايس logDice‏ فیضاف إلى 


Yot 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


تا — بناؤها وطرائق الإفادة منها 


معادلة الدايس الآتي:(1ع10 +14 (2]88/)184+18 . فلو نظرنا إلى المثال الذي 
ذكرناه آنفا حول المادة العنقودية (عاصف أو عاصفة) مع الصفتين اللتين 
تصاحبها ‏ مدونة المعاجم العربية: (شديدة وقاشرة). فإن الحسبة الآلية 
تكون على النحو الآتي: 

تكرار الصفة المتصاحبة (شديدة) للكلمة الأساس (عاصف أو عاصفة) 
وفقا لتكرارات كل واحدة على حدة مع تكرارهما معًا وبناء على الدايس ومعادلته 
2AB/)۸+۴8(‏ تكون النتيجة: ۱6۱۹+۱۲۰(/۵۰)< ۰,۰۰۳۰۵ وقيمة اللوج 
دايس ۱۱:۵ أما تكرار الصفة المتصاحبة (قاشرة) للكلمة الأساس (عاصف أو 
عاصفة) وفقا لتكرارات كل واحدة على حدة مع تكرارهما معًا وبناء على معادلة 
الدايس (2۴۸8/)۴۸+8تكون النتيجة 0.0303 -(4/)120+12. وتكون نتتيجة 
اللوج دايس ۵, ۰۱۲ وبناء على النتيجة الأولى والثانية نجد أن الثانية الأعلى 
من الأولى ذات قيمة علياء وينظر للأعلى أو الأقل بحسب ما يريده الباحث من 
الفرضية من حيث قوة التصاحب من عدمه |[ 0۷]. 

ه. ؛. علاقة بناء المدونة اللغوية العربية الحاسوبية وأدوات 

التحليل بطرائق البحث اللغوي 

على كل باحث -2 (ob‏ ذي بدء أن ينطلق من فرضياته اللفوية ثم یوجد 
المدونة اللغوية العربية الحاسوبية أو الأدوات اللغوية أو بهما معاء والتي يمكن 
لها أن تجيب عن تلك الاأسئلة. أو أن ينظر إلى خصائص الدونة اللغوية العربية 
الحاسويية من أجل أن ینطلق من كلك الخصائص التي تکیف أصلا أستلة 
الت القوي ومن كلذ الجهتین las‏ الحدس اللقوی الق اولان كم AT‏ 
تياد ا a‏ شريطة أن يكوه اعمالهنا ازام مک یا رمقو دق 
المحصلات النهائية للتجربة. ويكونان ممًا برهانًا للفرضية اللغوية الصفرية 
المصوغة, والمدونة المحددة للاختبار. وهنا تكون إجابات الأسئلة التي ذكرناها 


Yoo 


Wi‏ المدونات اللغوية العربية 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها ورقيا 
او تداو لیا تسا با 


SET انس فادها هل من اکن تهنا ا اک ها‎ RA 
٩ا البحث اللغوي؟ وهل للبحث اللغوي المعتمد على المدونات شروط منهجية؟ ولاذ‎ 
فجواب (هل) هنا هو أن كل مدونة لغوية حاسوبية يستحيل أن تجيبنا عن كل‎ 
الأسئلة؛ لأن الأسئلة هنا تتحدد بماهية المدونة بحسب نوعها أو غرضها أو عددها‎ 
. (McEnery and Hardie 2012: 27 أو تصميمها (ميكنري وهاردي‎ 

آما الشروط المنهجية فتتحدد بطريقة يوفقها الباحث اللفوي مع العلماء 
المختصين بمعالجة اللغة الطبيعية .Natural Language Processing‏ وأما 
السؤال (SIU)‏ فهو أساس البحث اللغوي العام أو الخاص. sel‏ أساس المنهج 
المتبع بتتبع نوع الدونة. وتتبع نتائج الرزم الاحصائية. وتوافق تلك النتائج 

ه. ه. تحليل التصاحب اللغوي 


يجب تبسيط مفهوم التصاحب ET‏ وهو مفهوم مركب يمكن تقديمه على 
النحو الاتي[/0]: 

أولاً: ب Adae‏ تحلیل المعاني المركبة بمجموعة من الدخلات المعجمية 
المتصاحبة 2 التصوص, فالتصاحب collocation‏ يعد ارتباطا تركيبيًا أوليا 
لوحدتین معجمیتین معا 2 سياق لغوي معین. مثل: یستقل/یرکب/یستعمل 
القطار. وقد یخرج عن التعارف عليه عند مزيد من الکشف عن مستویات 
النصوص اللفوية العربية الرقمية. 

ثانیا: 3c‏ عملية تحلیل العاني الركبة بمجموعة من الدخلات المجمية 
التلازمة .2 النصوصء فالتلازم colligation‏ يعد ایقاعا تركيبيًا الزامیا 
لوحدتین معجمیتین معا 2 أي سیاق. مثل: الفعل اللازم والفعل التعدي وحروف 
الجر وما بعدها من أسماء معرفة ب (JÍ)‏ وغیرها من التلازمات. 


Yor 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداو لیا تسا با 


قفا esce‏ لحان ال p‏ فا موه من اک jussa ci‏ 
التجاورة 2 اللصوص. فالتجاور collostruction‏ يعد ایقاعا ترکیبیا متغيرا 
لوحد ات معجمية نظمية توليدية 2 سیاقات عديدة؛ مثل: الکملات أو التممات 
complements‏ 2 توليد بقية الجمل الإسمية والفعلية الأساسية من الأحوال 
والصفات والتمييز وأدوات الربط conjunctions‏ التي تولد مزيدًا من التولید» 
والتلازمات النحوية التي تزيد عن أكثر من ثلاث كلمات؛ مثل: الفعل المتعدي, 
ولا النافية للجنس, والأفعال الناسخة. وأخوات إن واسمها وخبرها. وظن 
وأخواتهاء والالتزامات المتتابعة بمزيد من التجاور النظمي. كل ذلك -2 سياق 
تجاوري نظمي يمك من خلاله تحليل قواعد التركيب construction grammar‏ 
( جولد بيرج 2009 (Goldberg‏ . 

رابعًا: 2 عملية تحليل العاني المركبة بمجموعة من الدخلات المعجمية 
المتباعدة 2 المدى span‏ والمتقاربة 2 الدلالة (الجموعة الدلالية semantic‏ 
set‏ أو التقارب الدلالي ut (semantic preference‏ التضام هو الحك. وكثرة 
التعارف عليه تكشفه اللغة الطبيعية المحوسبة 2 الدونة الضخمة large-scale‏ 
‘corpus‏ مثل: اصطاد السمك من قارب أو زورق Y)‏ يحدث 2 العادة اصطياد 
السمك من متن باخرة أو سفینة) . 

ودراسة هذه الأنواع قد تکون على مستوی الکلمات أو مستوی النصوص من 
جهة. وعلی مستوی التصاحب مع كلمة 4 نص وتوافق هذا التصاحب من عدمه 
-2 نص آخر من جهة آخری. وأول من اهتم بنظرية التصاحب هو فیرث Firth‏ 
(140V)‏ وجاء من بعده سنکلیر NAAN) Sinclair‏ ۰)۲۰۰۶ والفرق بینهما هو 
أن الأول قد اهتم بالدی span‏ بغض النظر عن الوضع position‏ واهتم الثاني 
بالموضع بغض النظر عن المدى. آما مفاهيم جريس Gries‏ التي ذكرناها GT‏ 
فهي أكثر دقة من كل من فيرث وستكلير. 


Yoy 


Wi‏ المدونات اللغوية العربية 


تا ne‏ بناؤها وطراثق الإفادة منها 


هذه االظبعة 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسار با 
ود 


وقوائم التصاحب اللفظي التي يمكن الحصول عليها بآدوات معالجة العربية 
قد لا تجیبنا كثيرًا عن السؤال اللغوي العام: ما فائدة هذه القائمة من الناحية 
اللغوية؟ ولعل أعم إجابة يُمكن أن تبرهن عن فائدة واحدة لهذا القائمة هو أن 
بعض التكرارات المتعلقة بأدوات الربط conjunctions‏ والحروف particles‏ 
(حرف الجواب والنفي والشرط والتوكيد والتمني والصلة والترجي والنداء 
والأمر والجر والنهي والجزم والحروف المشبهة بليس والحروف المشبهة بالفعل 
الخ) i‏ وأسماء الإشارة والضمائر قد تعطينا ملمًا عن نتائج هذه المدونة المحددة 
بحدود ماهيتها من حيث النوع والعدد والحجم. وهو ملمح قد لا يتجاوز فكرة 
طريقة التركيب والاستعمال التركيبي بين كل هذه الأدوات وما يرد بعدها وقبلها. 
وما تفيده 2 تطبيقات التحشية الإحالية anaphoric annotation‏ من جهة. 
وأشكال التنوع variation‏ الاستعمالي من وجهة نظر لغوية سوسيولوجية. 
وثمة مناح آخری جديرة أوليًا بالاهتمام 2 مجال التحليل التصاحبي 2 
آي مدونة. ds‏ قضية التصاحب collocation‏ والتجاور .collostruction‏ 
ولو أخذنا على سبیل المثال ما Sketch Engine spag‏ -2 نظام لغة استعلام 
المدونة Corpus Query Language CQL‏ ( یا كوبيتشيك وآخرون Jakubíček‏ 
set al‏ ۲۰۱۰) والذي يتيح البحث ك الدونة عن طریق خواص الترمیز 
gsJM[attributez»value»]‏ صيغة الکلمة أو بالاعتماد على رموز التوسیم للغة 
العربية ( مجموعة وسوم ستانفورد ومنى دياب لأقسام الكلام Stanford's Mona‏ 
:Diab's Part-Of-Speech Tagging Sets‏ ومئى دياب Ten‏ ف ب AMIRA‏ وهو 
مطور من توسيم MADA‏ انظر: دياب Diab‏ ۰۲۰۰۷ ۲۰۰۹ وانظر حول مدى 
۸ عند: حبش وآخرین 2009 (Habash et al‏ . ولو آراد الباحث على 
سبیل JU‏ استعمال هذه الخاصية من أجل الکشف عن البحث على استعلامات 
الضمّن within and containing queries‏ أو على استعلامات الاتحاد meet‏ 


Yo^ 


قند ۱ انار وق 
إضداء من المركر 


ولايسمح بنشرها ور قیا 


أو تام لیا تجاربا WI‏ المدونات اللغوية العربية 
هد بناة‌ها (ail lag‏ البفادة منها 


and union queries‏ 57 الخواص الترميزية لكل مشغل على حدة فرصة 
(انظر الشكل (VV‏ وهذا كله سفن ب «مشغل الضمن أو الاتحاد withingand‏ 


.)١5 الشکل‎ ( «containing or meet and union operator 


user: Dr. Sultan Aimujaiwel corpus: ArabicLexicons 


Simple query: Make Concordance 
Query types Context Text types 
Query type Û simple Û phrase O word © character ® CQL 
Phrase: 


Word Form: PoS: unspecified v 


Character: 


CQL: [tagz V." tag!" V.*"][tag- " PR."] Default attribute: tag v | Tagset summary 


Make Concordance || Clear All 


الشكل (Y)‏ برنامج المستخدم للنظام: نافذة حوار نظام الاستعلام 2 Sketch Engine‏ 


-2 الشكل )17( نلحظ أن المدونة المستعملة هي مدونة المعاجم العربية 
YE)‏ معجمّا عربيا قديما وحديثا). وبالنظر إلى هذا الشکل, نلحظ خاصية 
الاستعمال COL‏ التي تعتمد على أساس خواص الترمیز لكل مشغل مذ كوو آنفا. 
ومن المکن للباحث اللفوي هنا أن یتصدی للحروف والاأحوال وآدوات الربط 
والتعابیر الاصطلاحية والجمل الفعلية. وذلك بنظام التوسیم الذي تقوم عليه 
Sketch Engine‏ ( ستانفورد STANFORD‏ وأميرة AMIRA‏ انظر: دیاب 
(Diab 9‏ وفیما يلي نشير إلى مثال تطبيقي لمشغل الضمّن آو الاتحاد: 


Yos 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
ادك — 


[tagz»PR.*»] within [tag=»V.*»] [tag!»V.4»] [tagz»PR.*»] within 


توسيم يُظهر الأفعال اللازمة 2 مدونة العاجم العربية. ونتيجته: 
ETI‏ من ۲١,٤۳۲,۲۱۲ dual‏ كلمة 


الضمّن 
Containing‏ 


[tag=»V.*»][tag!=»V.+»][tag=»PR.*»] meet 
الاتحاد توسیم یظهر الفعل العربي وامتداده 2 نصوص مدونة العاجم العربية.‎ 


sich‏ ونتيجته 457,06٠‏ من أصل ٠١,457,7١7‏ كلمة 

وهذان الترميزان أنموذجان لطريقة البحث .2 Sketch Engine‏ وثمة 
العديد من الترميزات التي تتيح الكشف عن أنواع مواد الكلمة المعجمية lexical‏ 
word-items‏ (الجمل الفعلية والمتصاحبات الاسمية من الأعلام وأسماء 
المؤسسات والأفعال اللازمة والإضافة والتعابير الاصطلاحية والتضام الدلالي 
المنسجم؛ انظر إلى نظام توسيم أقسام الكلم للعربية الخاص بأميرة 2: حبش 
۰ ) والتي يستطيع الباحث اللغوي أن يستعين بها من قبل المختصين 
بلسانيات المدونات. 

sud ssh] ااي ع طاريق‎ calis قراس الشكليل‎ didi osos 
وما یتبعها من متصاحبات مع امكانية تقديم تفسيرات احصائية‎ nodal item 
أربع: الكلمة الأولى: والكلمة الثانية. الكلمة‎ positions لقوة التصاحب 2 مواضع‎ 
الثالثةء والرابعة. وهي مزية ی لأداة غواص, وتتميز بهاء ولا توفرها أداة‎ 
(V الشکل‎ ( Sketch Engine 


قند dai‏ 
اشداء من المركر 


ولايسمح بنشرها ورقيا 


تفت ٩‏ المدونات اللفوية العربية 
تا — بناؤها وطرائق الإفادة منها 


10821166 و‎ z-score, t-scores MI |احصائیا ب‎ 


وبالنظر إلى هذا الشکل. سنلحظ أن التتابع السابق يعني: التتابعات 
السابقة. والتتابع اللاحق يعني: التتابعات اللاحقة. والستوی يعني: الوضع 
0 الذي یعکس موقع التتابع بوصفه التتابع الأول (الستوی الاول) . أو 
المتتابع الثاني (الستوی الثاني) . أو التتابع الثالث (الستوی الثالث) i‏ أو التتابع 
الرابع (الستوی الرابع). وبهنه الزية العالجاتية. فان للباحث اللغوي القدرة 
على کشف مواضع التتابع الباشر وغير الباشر مع قراءة احصاءاتها التعلقة 
وفق ذلك الوضع. 
الاتجاهات البحثية الممكنة 

لا يمكن حصر کل الاتجاهات المكنة. ولكن ثمة ما قد يفتح للباحث اللغوي 
آفاقا ما إن يعمل بها فإنها ستدفع بما سیشغله 3 الدرس اللساني. وتعد الاتجاهات 
البحثية اللغوية والترجمية والمعجمية بوساطة الاستناد إلى مدونة لغوية عربية 
حاسوییة[0۹] أولية من جهة الواقع الحيوي للوحدات الجذعية وما يلتصق بها 
من لواصق اشتقاقية وتصريفية مستجدة. والتراكيب اللغوية وما يتغاير فيها من 
حيث الأهمية لمواد الكلمات المعجمية lexical word-items‏ والتقارب الدلالي 


YA 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
—— 


semantic preference‏ والکشف عن بيئّات هذه الوحدات المعجمية الاستعمالية 
من حيث الاشتقاقات والتصاحب والدلالات اللغوية وغير اللغوية ( اجتماعية. أو 


نفسية:؛ أو أكاديمية؛ الخ). 
in‏ أو اكاديمية الخ) 


الاتجاهات البحتية المحتملة 

من الاتجاهات البحثية ا لحتملة: إعادة النظر من جدید 4 مفاهیم التصاحب 
اللفوي, وتلك التقسیمات المذكورة آنفا (انظر ۵. ۵.) التي تحتاج أبحاثا على 
مستوی المؤسسات والأفراد. وسیفرض هذا الاتجاه رسم الأبعاد الاستعمالية 
للوحدات العجمية 2 العجم الذهني العربي. والوصول لقواعد بیانات تتضمن 
یر اكا Ga ss‏ فق Laos Loss mgl‏ ان والقين dst‏ 
وتلازمها نحوياء وتجاورها تركيبياء وتضامها دلاليا. 

ان قواعد بيانية حاسويية لهده اران التصاحبية الأريمة ستفتح آفاقا 
لعرفة لغوية عربية حية تتولد من عقول مستعملي AMI‏ وتعیش بعيدة عن 
البعثرة من جهة الحدس, وأي لغة لها تاريخ استعمالي تاريخي طویل (کحال 
العربیة) یتحتم فیها آن تمثل 4 تلك القواعد البيانية ‏ 23905 اتجاهات؛ الأول: 
تعاقبي diachronic‏ والثاني: آني (تزامني) synchronic‏ والثالث: التوقیف 
compromise‏ ( اللغة التوقيفية compromise language‏ أو اللغة الوسیطة) 
]٠١[‏ التي تتوسط بين التفیرین الزمني و الوصفي من جهة والتقليدي واللهجي من 
جهة تانية والعمل المؤسسي على تحدید الستویات النموذ جية standard levels‏ 
من جهة ثالثة ( انظر: مول Moll‏ ۲۰۱۰-۲۰۰۸ وانظر الحمزاوي ۱۹۸۲)؛ کل 
ذلك من آجل السمي إلى التمثیل البياني اكرول up‏ واا تمد 8st Lon‏ 
العربية. 


قند ۱ انار وق 
VELINT‏ المركر 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 


الاتجاهات البحثية المأمولة 

من المأمول مستقبلاً توسيع دوائر معالجة اللفة العربية بأدوات حاسوبية Sh‏ 
لها أن توفر للباحث اللغوي العربي مزيدًا من التحلیل. وذلك عن طريق تطوير 
معالجات التوسيم النحوي part-of-speech tagging‏ ( أو التوسيم القواعدي 
(grammatical tagging‏ واستحداث بدايات جادة للتوسيم الدلالي semantic‏ 
8 والإحالي anaphora‏ والنبري prosodic‏ والتي duda‏ الباحث اللغوي 
بمزيد من وقائع التحليل اللغوي لوقائع اللفة العربية الحية. 

ومن المأمول أيضًا أن يكون هناك اهتمام بالمدونات المتقابلة comparable‏ 
8 والمدونة المتوازية parallel corpus‏ حيث تفيد الأولى 4 الكشف عن 
التقابلات السياقية اللفوية الاستعمالية بين مدونتین تتوافقان .۶ العطیات 
الزمنية والوعائية والجالاتية والوضعية والسياقية. وهذا الرحلة كلما زادت 
جذتها زاد عونها للمختصین 2 معالجة اللفات الطبيعية بفهم أعمق لالیات 
الترجمات الالية؛ آما الثانية فستفید 4# معرفة مزید من القابلات الترجمية 
السياقية الطبيعية. والتي سیکون لها دور 2 فهم آي القابلات من اللفة الهدف 
آولی استعمالا من حيث الأكثر تكرارًا من جهة السیاق. 


موضوعات مقترحة في البحث اللغوي الحاسوبي 

یعتمد البحث اللفوي على تحلیل معلمین آساسین من وجهة نظر العجمیات 
التركيبية structural lexicology‏ ( انظر لییکا 2002 (Lipka‏ وهما: العلم 
الضملفوي (تحلیل اللفة بالنظر إلى مکوناتها الداخلية بنیویا من الصوت إلى 
الدلالة) والعلم الفولفوي (تحلیل اللفة بالنظر إلى مکوناتها الخارجية وجودیا 
من النفس فالتربية فالتعلیم فالثقافة فالعرفة وصولا إلى التکوین الأم: ele‏ 
الوجود). 


Wi‏ المدونات اللغوية العربية 


تا — بناؤها وطرائق الإفادة منها 


هذه الطبعة 
اشت! Š‏ ۱۹ المركر 
و لا يسمح بنشرها ورقيا 
a‏ تداولها تسار با 
EE‏ 


وستقترح هنا موضوعات 2 البحث اللغوي الحاسوبي تكون مادتها اللغة 
الحية ( أي مدونة لغوية حاسوبية محفوظة 2 امتداد txt‏ أو (CSV‏ وأدوات تحليل 
هذه المادة اللغوية (وأفضلها: غواص (Sketch Engines‏ . 

وأذكر هنا بعض الوضوعات التي يُمكن أن تقترح. ليس من أجل بحثها بل 
من أجل تقریب الصورة 2,1 تتطلقات البس اللقوى بذ الدونات a all‏ 
الحاسوبية وتحدید نوع الدونة. ومن ثم فالفرضية تکون صیاغتها بداية تحدید 
البنية الصورية thematic structure‏ لأية ورقة بحثية لفوية معتمدة على الدونات 


العربية وآدوات تحلیلها ومعالجتها آلیا. 


el il‏ التراکیب النحوية من | معاصرة (صحف/ سردیات | التراکیب التنوعة بتنوع 
حيث التصاحب والتلازم وروایات) الجالات 


معاصرة (صحف/ سردیات التراكيب التنوعة بتنوع 
وروايات) الأوعية 


أنواع التراكيب الاسمية من | مقارنة بين مدونة تراثية مواد الكلمات المعجمية 


حيث أنواع مواد الكلمات ومدونة معاصرة وأنواعها 4 العربية 
المعجمية lexical word-‏ 


items 


العربية التراثية 


تحليل التعبيرات الخاصة اشهاع آجزاء کل مسون 
بدقائق المواد الثقافية أو موجود على حدة 


11 والتمائل النصي 


isotexutal 


الكلمة 2 السياقات الشعرية 


تحليل توافق التقافة 
االعجمية 


التطابقات لجميع الأفعال 
الزائدة عن الجذر root‏ 
والجذع stem‏ 


تحليل الأخطاء من حيث 
الأعمار/ الخلفية الثقافية/ 
البيئة التعليمية الخ. 


هذه العظبعة 
IET‏ من المركر 
ولايسمح بنشرها Led pg‏ 
او تداولها تحار پا 
بود 


الكتب التراثية/ أو الصحف 
و 
العربية القطرية 


الرواية العربية أو المحددة 


عربيا من حيث الجغرافيا 
السياسية 


والحديث 


المدونات المتقابلة 


اعمال tokenization‏ و 
0 لأ جل 


التصدي لها 


الفيفي وأتويل al-Faifi‏ 
and Atwell‏ ۲۰۱۶ (مدونة 
متعلمي العربية Arabic‏ 


(Learner Corpus 


Yo 


WI‏ المدونات اللفوية العربية 
بناؤها وطرائق الإفادة منها 


نسية التطابق والتغاير بين 


الموضوعية 


الاتجاهات الاستعمالية 
للوحداث المفجمية 


التنوع 2 الدلالات الشعرية 


بين لغتين فيهما أثر التشابه 
أو الاختلاف بين الدوال 
اللغوية ومدلولاتها 


الاشتقاقات القديمة 
والجديدة 


الاختصاص الدلالي 
للوحدات المعجمية مكانيًا/ 
زمانيًا/ ثقافيا 


معامل الارتباط بين نوع 
الأخطاء والخلفيات العمرية 
و/أو الثقافية و/أو العمرية 
لغير العرب 


هذه الطيعة 
إخداء من الرکز 
ولايسمح بنشرها Led pg‏ 
او تداولها تسار با 
ود 


خاتمة 

عرض LE‏ أهم الأدوات اللفوية التحليلية للنصوص العربية. ومفاهيم 
ال العربية الحاسوبية وآهم آنواعها. ومفهوم التصاحب اللفظي من وجهة 
نظر لسانية مدونيّة حاسوبيةء وأهم الطرائق الإحصائية من حيث قياس القوى 
والمدى والتجاور والتضام. وأثر هذه القياسات الإحصائية 2 دعم الفرضيات 
اللغوية من عدمه. ولا غرو أن نلحظ أهمية هذه الاتجاهات 2 الدراسات اللغوية 
العالية. واللغة العربية ليست بمنأى عن المستجدات البحثية اللغوية لخدمة لغة 
الضاد. ولقد وقف الباحث على ما يزيد عن ۰۰؛ دراسة آجنبية. وقد كانت آدوات 
وورد سميث WordSmith Tools‏ منطلقها الأساس .2 تحلیل فرضياتها المتعددة. 
إن دخول المهتمين 2 اللغة والآدب إلى هذا المضمار سيبني Gl‏ جديدة لمزيد 
من التقسیر والتحلیل الآ والاحصائي والنوعي الحذر, وسيضفي آفاقا رة 
تعين على مزید من استیعاب واقع اللغة العربية بوصفها لغة حيّة مُنتجّة بالصور 
القياسية لستویات العربية النموذ جية کلها. 


الحواشي 

[t0]‏ تتفرع الدونات إلى ما هو آکثر تفصیلا من هده التفریعات التي 
تتعلق بعدد لفة الدونة, وهنا آذکر -بشکل موجز-التقسیمات العمول بها وفق 
النوع والغرض والعدد والتصمیم الخ. فعلی صعيد النوع. هناك مدونات لغوية 
حاسويية للغات الکلاسيکية. وهناك ما هو للغة العاصرة. وهناك ما یتضمن 
آوعية 5 معينة مثل مدونة الصحف وهكذا دواليك. وثمة مدونات من 
حيث النصوص تتضمن نصوصا ليست کاملة وتعرف بمدونات العينة sample‏ 
5 ونصوصا حية كاملة من حيث الانتاج» وتعرف بالدونات كاملة اللصوص 
full-text 8‏ وهناك مدونات من حيث الوعاء الناقل للغة الحية. والذي 


۳۹۹ 


شنه ۱ انار وق 
إخداء من الرکز 
ولايسمح بنشرضا Led pg‏ 
او تداولها تحار پا 


يكون نصا مكتوباء أو منطوقا یحول إلى نص مكتوب. وتفترق الدونات أيضا 
من حيث التنوع الزمني. فهناك مدونة لغوية معاصرة مثل مدونة السليطي al-‏ 
Sulaiti‏ (۲۰۰۶) (مدونة العربية المعاصرة «Contemporary Arabic Corpus‏ 
انظر أيضا: السليطي2009 al-Sulaiti‏ ) ۰ ومدونة زمنية متعلقة بالتطور الزمني 
اللغوي مثل مدونة هيلسنكي للنصوص الإنجليزية the Helsinki Corpus of‏ 
English Texts‏ التي تتضمن مليون ونصف اللیون AGIS‏ للإنجليزية القديمة 
والوسطي وبداية العصر الحديث (۱۹۹۱). كما تتمايز المدونات أيضا من حيث 
مستعملي اللغة إلى مدونات اللغة الأم ومدونات اللغة الثانية أو الأجنبية للمتعلمين 
(مثل مدونة أبوحكيمة 2009 Abuhakema‏ ومدونة الفيفي وأتويل .)5١١7‏ أما 
من حيث الغرضء فهناك مدونات حاسوبية لأغراض عامة general-purpose‏ 
2 ومدونات محددة المجال .domain-specific corpora‏ أما التقسيم 
الثالث؛ فهو ما يتعلق بالعدد. أي: بعدد اللغة ب2 الدونة. وتنقسم إلى مدونة 
أحادية وتقابلية ومتوازية. أما آخر صنف تتمايز به المدونات فهو ما يتعلق 
بالتصميم (بمعنی آخر: بالتوسيم النحوي Part of Speech Tagging‏ والتحشية 
(annotation‏ حيث إن هناك مدونات لم يعمل لها توسيم وتخشية؛ أو تاق ة 
من حيث عناصر التحشية: فواصل الصفحات. والفقرات. والفوارق والتشاكل 
الاملائیین. والارقام. والزوائد. والرموز الأجنبية المختلفة عن رموز لغة المدونة 
الاصلية. وتواريخ النصوص, والولفین. والأوعية؛ والجالات. والوضوعات. 
والستویات اللفوية, والسجل اللغوي ( لزید من الآمثلة حول آنواع الدونات الغربية 
وأمثلتها؛ انظر: بیکر وآخرین 2006 (EY ۰۱۲۰ ۰۷۱ ۰:٩ :Baker et al‏ 
ووفقاً لهذا التصنیف. فانه لا يمكن أن یقوم باحث لغوي -علی سبیل الثال- 
بتحليل أنواع تراكيب الجمل الفعلية؛ أو وظائف حروف الجر الدلالية. أو تحليل 
الخطاب الديني 2 الثقافة العربية. أو تفسير الموجودات والمحسوسات والمواد 
الثقافية بعلم الوجود ‏ اللفة العربية باستعمال مدونة عربية معاصرة (مثل 


۳۹۷ 


Wi‏ المدونات اللفوية العربية 


تا مده بناؤها وطرائق الإفادة منها 


هذه الطيعة 
إخداء من الرکز 
ولايسمع بنشرها Led pg‏ 
او تداولها تسار با 
بود 


مدونة السليطي) أو باستعمال مدونة متعلمي اللغة العربية (مثل مدونة الفيفي 
وأتويل) إلا وأن يكون مدركا بأية مدونة يكون لها أساس علمي يجيب عن تلك 
الأنواع من التحليلات. 

[t]‏ التوسيم النحوي m Part-of-Speech Tagging‏ أيضا ب 
Grammatical Tagging‏ انظر: ميكنري وآخرون 2006 (McEnery et al‏ . 
والتوسيم الدلالي Semantic Tagging‏ والتوسيم النبري Tagging‏ ۰۳۲050016 
والتحشية ‘Annotation‏ كلها اجراءات حاسوبية مطلوبة لتطوير أي مدونة 
حاسوبية. وكل هذه التوسیمات. وبالأخص التوسيم النحوي؛ يصعب |نجازها 2 
المدونة العربية الحاسوبية لسبب یعزی إلى حاجتها إلى تطوير التوسيم النحوي 
بصورة يدوية لاقسام الکلم شكلا ووظیفة من أجل ضمان تطابق آکبر وآدق. 
ولو قلنا -مثلا-مدونة مكونة من ملیون کلمة. فان توسیم آقسام الکلام فیها 
يدويا یحتاج إلى فریق عمل یصل إلى المائة ربماء وینجز التوسیم بشکل يومي 
يدوياء وعلی مدی سنوات عديدة على آقل تقدیر. وثمة توسیمات نحوية مقتر حة 
وعديدة» ومعظمها یمکن أن تحقق نسبّا مرضية من التطابق. ویری الباحث 
أن نسب التطابق ب2 الدونات العربية لا يُمكن أن تتجاوز نسبة ZV*‏ للمدونات 
بسبب صعوية ضبط کل وظائف الکلمات العربية التنوعة بتنوع آنظمتها الخطية 
والصوائتية والتصريفية والنوعية والوظيفية. ویری الباحث آیضا أن أي منجز أو 
اقتراح أو عمل تکون جهویاته منصبة على محاولات تطویر التوسیم النحوي .2 
العربية, ولا يكون مقبولا بافتراضاته .2 اختباره وفحصه آلياء فإن نطاق تطویر 
التوسیم النحوي العربي سیکون منحسرّا ولن یکتب له التطویر. 

.[£0] انظر إلى الحاشية رقم‎ [£V] 

[£A]‏ ثمة مدونة متوازية ليست متوفرة. وصّممت من قبل جامعة جون هوبكنز 
John Hopkins University‏ وهي مدونة توازي مقومات constituents‏ الآيات 
القرآنية بمقابلاتها الترجمية 2 الانجليزية. أي آنها مدونة تتضمن آیات القرآن 


YM 


قند العظيعة | 


اخداء من E 5$ A!‏ 
والايسمح Li piia‏ ورقيا s‏ 8 
أو تداولها تجاريا 6 المدونات اللغوية العربية 

2 — بناؤها وطرائق الإفادة منها 


الكريم وما يقابلها 2 الترجمة الفعلية؛ حيث لكل مقوم وعنصر لفظي 2 كل آية 
ما 435153 ( أو يحاذيه aligning‏ من محاذاة (alignment‏ من مقابلات 2 اللغة 
الإنجليزية. وحيث إن هذه المدونة ليست متاحة. فلا يُعلم ما إن كانت النصوص 
الترجمة دقيقة للنص القرآني Y el‏ 
[£A]‏ ينقسم معظم المدونات العربية الحاسوبية من حيث التوسيم إلى قسمين؛ 
الاول: شبه الموسّمة semi-tagged‏ ( بخلاف partially tagged‏ الموسّم جزئيًا) 
كحال مدونة آرابیکوربوس ۱۷۳,1۰۰,۰۰۰ مليون كلمة arabicCorpus http://‏ 
.<< الدونة العربية KACSTAC‏ بنسختها الجديدة. 
أما القسم الثاني فهو غير الوم non-tagged‏ كحال معظم المدونات العربية 
العامة. ومنها مدونات العربية الشبكية Y ' V) Arabic Internet Corpora‏ مليون 
کلمة) ل سيرج شاروف Serge Shroff‏ ) انظر: http://smlc09.leeds.ac.uk/‏ 
.(query-ar.html‏ ولا توجد مدونة Anpe‏ حاسوبية موسومة بصورة کاملة 
کحال. على سبیل (JUI‏ مدونة بیرمنفهام الانجليزية WordBanks Online‏ 
(البنك الانجليزي Bank of English http://wordbanks.harpercollins.‏ 
(co.uk/Docs/Help/guide.html‏ . ثمة مدونات عربية تتضمن نصوصا عربية 
رقمية. ولا يُرى إضافتها هنا نظرًا لاختصاصها بسجلات لغوية وأوعية لغوية 
خاصة للعربية. هذا بالاضافة إلى عدم تجاوز عدد كلماتها ٠٠١‏ مليون كلمة 
) انظر: (http://www.kacstac.org.sa/osact/UsefulResources.html:‏ ; 
ومنها الجدّع جزئيا partially tokenized‏ والموسم partially tagged Lá j>‏ 
(وليس شبه الوسم semi-tagged): Arabic Gigaword Corpus Firth‏ 
0 ( انظر الثبيتي 2014 (al-Thubaity‏ . 


/ Barlow 2014) http://www.monoconc.com aL) انظر‎ ]۵۰[ 


TT Servieces' Oxford University [o]‏ برنامج يعالج النصوص وملحق 
بالمدونة الوطنية البريطانية ‘British National Corpus‏ انظر: http://www.‏ 


قند ۱ سای وق 
إخداء من الرکز 
والايسمح بنشرضا ورقيا 
او تداو لیا تسا با 
2 د 


natcorp.ox.ac.uk/tools/index.xml‏ ويمكن تحميل البرنامج من هذا الرابط 
z http://sourceforge.net/project/showfiles.php?group. id‏ ۰۱۳۰۲۸۹ 


ويدعم هذا البرنامج تحليل مصادر لغوية ضخمة ومدونات لغوية طبيعية على 
امتداد ملفات .XML‏ 
[0Y]‏ انظر (تسوکاموتو Tsukamoto n.d.) http://www.chs.nihon-u.‏ 


ac.jp/eng dpt/tukamoto/index, e.html 


Roberts 2014) http://www.andy-roberts.net/ انظر (روبرتس‎ [oY] 


coding/aconcorde 


Scott 2012) WordSmith Version 6 http://www. انظر (سکوت‎ [o£] 
lexically.net/wordsmith/version6/index.html 

al-Thubaity et al (ACP Tool) 2013 http:// انظر الثبيتي وآخرين‎ [00] 
sourceforge.net/projects/kacst-acptool 

https://the.sketchengine.co.uk/login انظر:‎ [03] 

[ov]‏ هذه القياسات الإحصائية كافية فيما يراه باحث هذه الورقة. وهي 
أساس البحث اللغوي 2 أي مدونة لغوية حاسوبية. وثمة حزم أخرى لا تختلف عن 
MEINE SP EA EET‏ تا کر نخان الها 
يقربٌ من فوائد المعطيات الأساسية ذاتها ( أي: قبول قوة التصاحب من عدمه) . 

Stefan على نقل مفاهيم ستيفان جريس‎ talal يقوم هذا التقسيم‎ [0A] 
حول إعادة نظرته إحصائيا لمصداقية التحليل الحاسوبي لأي‎ )۲۰۱۰( Gries 
مدونة. ويلخص من خلال تحليليه أن أية مدونة من حيث الأصناف الاربعة:‎ 
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الإحصاءات بما يتوافق وعينة تلك الأصناف الاربعة. وبشكل دقيق فيما يخص 
التصاحب أو التلازم أو التجاور أو التضام (التقارب) . 

oes Sot o Lo‏ كترم شیطیا agua‏ ها کون Roda‏ سرا 
وهي قابلة للدحض بلا شك؛ وشكل ضبطها هو على النحو الآتي: التصاحب 
10 والتلازم .colligation‏ والتجاور .collostruction‏ والتضام 
(الدلالي) semantic set‏ والعاني اللغوية لكل مقابل quoe‏ هي: مفهوم 
التصاحب (أي: القريب اللفظي المباشر) أو التلازم النحوي (القريب النحوي 
الباشر) . أو التجاور (التجاور اللفظي تركيبًا وغير الباشر) c‏ أو التضام الدلالي 
ul)‏ التقارب الدلالي (semantic preference‏ أي: التضامات الدلالية التي 
تشترك 2 العلاقات الوجودية للحقول الدلالية ontological relationships of‏ 
)Arabic semantic fields‏ انظر الحاشية 4: ). وهذا الأخيرة هي حلم الدرس 
اللفوي العربيء ویتحتم أن تكون als‏ مأمولا لكل مختص عربي 2 الدرس 
اللساني الحدیث. وعلى كل باحث لغوي أن يأخذ 2 تخصصه شيئًا من التقنيات 
التي Lapas‏ أدوات معالجة اللفة آلياء والكيفية النموذجية © بحث سیکوّن 
مستقبلا US‏ يقدم لفراكه Vas sa‏ من التفتّق العر الذي ياد به باحثون جدد 
حول هذا الوضوع. EN‏ ونا کر lia‏ هو شرط العلوم البنائية 2 
العلوم الحديثة. 

]94[ الإقارة هذا ای احدى الات اتر العوسية الى شا 
من أنماط البحث التمكينيّة؛ والمتوفرة 2 نظام الاستعلام query system‏ أو 
بالاستناد إلى مدونة عربية يقوم الباحث بجمعها 2 ملف text‏ ومن ثم اضافتها 
إلى أداة من آدوات تحليل اللغة العربية وأفضلها غواص و .Sketch Engine‏ 
وتربط هذه الخصائص البحثية بثلاث مدونات عربية رئيسة؛ كل واحدة 
منها توقر أدوات تحليلية خاصة بها. ولزاما على كل باحث لغوي أن ينظر إلى 
مستجدات تلك المدونات العربية الثلاث: المدونة العربية (مدينة الملك عبد العزيز 
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تا — بناؤها وطرائق الإفادة منها 


قند ۱ سار وق 
إخداء من الرکز 
ولايسمح بنشرها ور Led‏ 
او تداو لیا تسا با 
— 


للعلوم والتقنية) httpz//www.kacstac.org.sa‏ /۰ ومدونة أرابيكوربوس ) جامعة 
بريغهام يونغ الأمريكية ) .http://arabicorpus.byu.edu/‏ ومدونة جامعة ليدز 
لمحتوى العربي الشبكي من بعض الصحف وكامل الويكيبيديا http://corpus.‏ 
.leeds.ac.uk/internet.html‏ وك كل مدونة من هاته المدونات أدوات بحث 
خاصة تتطور. غير أن أكثر الأدوات الواعدة تطورًا فيها هي المدونة العربيةء 
ومن ثمة مدونة أرابيكوربوس كونها قد زادت من عام ۲۰۱۰ حتى عام ۲۰۱۲ بما 
يزيد عن ٠١‏ مليون كلمة مع إمكانية البحث عن الجذر اسميًا وفعلیّ . وعن الجذع 
ولواصقه الاشتقاقية والتصريفية (word forms)‏ وعن إمكانية عرض النص 
الأصلي كاملا بتطابقات الكلمة المبحوث عنها. 

]1[ هذا الدراسة الأحتبية ودراسة الحمزاوي (AAT)‏ من قبلها تعدان 
الحك الأساس والتحدي الأکبر لقضایا اللغة التنوعة زمنیا ووصفیّا من جهد. 
ومن جهة ثانية: التحدي الآخر الذي یتطلب من المؤسسات أن تجعل من التوقیف 
( أو التوسیط) للمتفیرات اللغوية استعمالا الاطار العام ل: التوصیف الدقیق لواد 
الثقافة العربية بالوحدات العجمية العربية. والاستعمالات التركيبية التوليدية 
الستجدة, والوحد ات العجمية العربية العربة والدخيلة. والأساس لها جميعًا 2 
بناء مواد العربية التعليمية ومعاجمها متعددة الأغراض. 
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الثبيتي» عبد الحسن وآخرون. غواص. KACST, ACP Tools. http://‏ 
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DOR A EEA EE MET RIT S 
Ys ١ الریاض:‎ emit سليمان الخلفية. دار جامعة الملك سعود‎ 
الحمزاوي. محمد رشاد. العربية والحداثة آو الفصاحة قصاحات. دار‎ 


العصيمي» صالح بن فهد. علم التون وعلوم اللفة. مجلة كلية الآداب والعلوم 
الانسانية. كلية الآداب والعلوم الانسانية, فاس (المملكة الفربیة) . العدد (QA)‏ 
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نظرة تأمل الماضي وا ستشراف المستقبل 


صالح بن فهد العصيمي 
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إضداء من | e‏ 
iem‏ 
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اخداء من المركر 0 
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تمة: نظرة تأمل الماضي واستشراف المستقبل: 

صالح بن فهد العصيمي 

إن الدونات اللفوية ولسانیات الدونات اللفوية حقل جدید نسبياً ب مجال 
العمل اللساني والدرس اللغوي (محمود: البحث الأول). وقد عرضنا 2 مباحث 
هذا الکتاب بعض الیادین التي طرقها هذا العلم 2 مجال البحث اللغوي الحدیث. 
وعلی الرغم من تعدد هذه الأبحاث والوضوعات والميادين فلا JU‏ الجال واسعا 
للاستفادة من الدونات 2 مجالات آخری وباستخدام طرائق شتی. ومن الهم 
الاشارة إلى أن العمل 2 مجال الدونات العامة أو التخصصة کمدونات التعلمین 
العربية. ووسمها. والاستفادة منها 2 مجالات البحث اللغوي - أو غیرها من 
الجالات - لا يزال 2 بداياتهء ویحتاج للکثیر من الدراسات لیصل إلى مستویات 
أفضل (الفيفي: المبحث الثاني) . وتلیق بلغة عالية كالعربية. إن دراسة العربية 
العاصرة. وقضایا بت سس > والدراسات التعلقة بتحلیل الخطاب 
العاصر لهي من الوضوعات التي ينبفي أن یلتفت إليها اللغویون العرب مسلحین 
بالأدوات المنهجية للسانيات sal‏ (الشمري والثبيتي: المبحث الرابع) .كما 
أن دراسة المفاهيم المعجمية مثل التصاحب اللغوي وغيره سيعيد رسم الأبعاد 
الاستعمالية للوحدات المعجمية 2 العجم الذهني العربي (المجيول: البحث 
الخامس). وكذلك فإن دخول المهتمين باللغة والأدب وفروع اللسانيات العربية 
التقليدية إلى مضمار لسانيات المدونات سيبني أطرًا جديدة لزید من التفسير 
والتحليل الآلي والاحصائي والنوعي الحذر. وسيضفي آفاقا رحبة تعين على 
مزيد من استيعاب واقع اللغة العربية بوصفها لغة حيّة مَنتجَة بالصور القياسية 
لمستويات العربية النموذ جية كلها ( المجيول: المبحث الخامس). 

إن هناك حاجة ملحة لانشاء مدونات متعددة للغة العربية مثل مدونة التلامین 
(مكتوبة ومنطوقة) 2# مراحل الاكتساب اللغوي والتعليم العام حتى يتسنى 


YAY 


هذه الطيعة 
إخداء من الرکز 
ولايسمع بنشرها Led pg‏ 
او تداولها تسار با 
بود 


للغويين دراسة الضعف اللغوي وتقديم الحلول حوله. ومثل ذلك 2 الأهمية إنشاء 
المدونات المتخصصة مثل الأكاديمية المنطوقة والمكتوبة» ومدونات الخطاب 
القضائي والسياسي والدعوي وغيرها من المجالات المتخصصة. كما أن هناك 
ضرورة قصوى لأن يعتمد المعجم العربي على الدونات. وأن يتعدد النتج المعجمي 
بتعدد مجالات المعاجم مثل معاجم التصاحب والترادف والتضاد وغيرها. 
بالإضافة إلى ذلك فدراسة العاميات واللهجات العربية دراسة قائمة على منهج 
لسانيات الدونات مهمة إذا أردنا المقارنة بين الفصحی ومستوياتها حتى نتمكن 
من توصیف آعمق لهنه اللفة المتدة علی ما یزید عن آربعة عشر قرنا. 

إن مما ينبفي التأكيد عليه أن مجالات لسانیات الدونات وان كانت تعتمد 
على التقنية التي اختصرت الجهد والوقت والال فانه لا غنی عن الفرق البحتية 
والممل الوسسي نظراً لضخامة العمل الذي ینتظر اللفة المريية ذ مجالاتها 
اللسانية الحديثة. 

ومما يبعث على التفاؤل أن هناك انطلاقة حقيقية يشهدها الدرس اللغوي 
العربي 2 مجال لسانيات المدونات: ويوجد حاليا مختصون 2 هذا المجال منهم 
الباحثون المشاركون 2 هذا الكتاب أثروا هذا الحقل الحديث بجهودهم الفردية, 
ومنهم الباحثون طلاب وطالبات الدراسات العليا -2 علم اللغة التطبيقي 2 
جامعة الامام محمد بن سعود الاسلامية الذين بدؤوا یتجهون إلى هذا النوع من 
الدراسات. بالاضافة إلى باحثين آخرین على امتداد العالم العربي وکذلك .2 
العالم الغربي والراکز البحثية التي تعنی بهذا النوع من الدراسات. وقد جاء هذا 
الکتاب الثري ada,‏ استعراضاً شاملا لسانیات الدونات الا أن متاك فرصة 
آخری لاصدار کتاب آخر یعالج القضایا التقدمة والسائل الأعمق والتطبیقات 
الأوسع -2 مجال لسانیات الدونات. وهوما نؤمله من مركز الملك عبد اللّه الدولي 
لخدمة اللغة العربية ومن غيره من الجهات العلمية والأكاديمية 2 العالم العربي 
عامة و المملكة العربية السعودية خاصة. 


۳۸۶ 


قند ۱ ار وق 


اهداء من المركز 


و لا یسمع بنشرها ور قیا 


او تداو لها تحار پا 
00 — 


مسرد المصطلحات 
LERE‏ 

توسيم إحالي 

suci مدای سا كل‎ da sation 
محاذاة آلية‎ 

قيمة محسوبة 

ون كاي 

تلازم نحوي 

5506 

نظرية التصاحب 

مؤشر التصاحب 

حزم سي uc‏ 
هذوتاك متقايلة (Qoa)‏ 
مكملات (متممات) 

لغة وسيطة 

ME السانات‎ 

صرفیمات سلسلية 

سطور الكشاف (المكشاف) السياقي 
آداة ربط ۱ 

قواعد الترکیب 

مدونة (متن) 


لسانیات المدونات (التون) 


YAO 


WI‏ المدونات اللفوية العربية 
بناؤها وطرائق الإفادة منها 


anaphoric annotation 
anaphoric tagging 
annotation 

automatic alignment 
calculated value 

chi square 

colligation 

collocation 

collocation theory 
collocational indicator 
collostruction 
comparable corpora 
complements 
compromise language 
computational linguistics 
concatenative morphemes 
concordance line 
conjunction 

construction grammar 
corpus 


corpus linguistics 


قند ۱ انار وق 


اخداء من المركر 
و لایسمع بنشرها Leä ja‏ 
او تداولیا تجارپا 
,2 مهد 


لغة استعلام المدونة 

منهج (مذهب) معتمد على مدونة 
بحث معتمد على مدونة 

منهج (مذهب) موجه بمدونة 
بحث موجه بمدونة 

الموجع القياسي لترمیز الدونات 
(معیار تشفیر الدونة) 

قيمة وافعية 

درجة التکرار 

لاصقة اشتقاقية 

تعاقبي 

ي 

مجال (نطاق) 

تحليل نصوص الكترونية 
تكرارات متوقعة 

تكرار 

لغة التعلیم العيارية العامة 


YA 


corpus query language 
corpus-based approach 
corpus-based research 
corpus-driven approach 


corpus-driven research 


Corpus Encoding Standard: 


CES 

critical value 

degree of frequency 
derivational suffix 
diachronic 

diachronic variation 
domain 

electronic text analysis 
expected frequencies 
frequency 

General Standard Markup 
Language: GSML 
genre 

grammatical tagging 
Historiography 
homonym 


inflectional suffix 


| aia - 31 شنه‎ 


إضداء من المركز = 
ولايسمح بنشرشا "IT‏ ۳ سیب سين z‏ 
أو تداو نیا تجاویا E AEA ABN‏ 
تج — بناؤها وطرائق الإفادة منها 


معامل كسب المعلومات Information Gain‏ 


تداخل اختصاصي (تداخل interdisciplinary‏ 
تخصصات متعددة) 

تماثل معجمي isolexical‏ 
تماثل نصي isotexutal‏ 
هندسة اللغة language engineering‏ 
مصادر اللغة language resources‏ 
مدونة ضخمة large-scale corpus‏ 
تجريد الكلمة من الزوائد lemmatization‏ 


مواد الكلمة المعجمية lexical word-items‏ 


لوج دايس logDice‏ 
معامل الاحتمالية اللوغاريثمي Log Likelihood‏ 
تعليم (من العلامة) Mark-up‏ 
معامل المعلومات المتبادلة mutual information‏ 


natural language 


natural language processing معالجة اللغة الطبيعية‎ 


المادة العنقودية nodal item‏ 
صرفیمات غير سلسلية non-concatenative morphemes‏ 
فرضية صفرية null hypothesis‏ 
تكرارات ملحوظة (مُلاحظة) observed frequencies‏ 
علم الوجود ontology‏ 
مدونات سانحة opportunistic corpora‏ 


parallel corpus مدونة متوازية‎ 


YAN 


شنه ۱ سار وق 


اضداء من A‏ 35 
والايسمح بنشرها ورقيا 
او نداولها تساريا 
—R 0‏ 

تحليل نحوي parsing‏ 
توسيم نحوي part-of-speech tagging‏ 
البوليزيمي AK)‏ ذات معان polysem‏ 
متعددة) 
توسيم نبري prosodic tagging‏ 
محرك استعلام query engine‏ 
نظام استعلام query system‏ 
register Tem‏ 
محرك بحث search engine‏ 
تقارب دلالي semantic preference‏ 
مجموعة دلالية semantic set‏ 
توسيم دلالي semantic tagging‏ 
مدى 


مستوى نموذجي (معياري) 
لسانيات المدونات الإحصائية 3 «آر» 


علم المعاجم التركيبي 

آني (تزامني) 

تنوع آني (تزامني) 
وحدات معجمية نظمية 
مبادرة yas‏ النصوص 
بنية صورية (موضوعاتية) 
الكلمة الفعلية 


span 

standard level 

statistical corpus linguistics 
with R 

structural lexicology 
synchronic 

synchronic variation 
syntagmatic lexical units 
Text Encoding Initiative(TEI) 
thematic structure 


token 


YM 


aia‏ الطبعة 
إخداء من الرکز 
lus EE]‏ 
او تداوليا تجاريا 
—— 


تجذيع 


لبنوك الشجرية 


۳۸۹ 


WI‏ المدونات اللفوية العربية 
بناؤها وطرائق الإفادة منها 


tokenization 
treebanks 

t-score 

type 

variation 

wildcard character 


Z-Score 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


iaiia] 2713‏ 
إشداء من المركر 
eua‏ بنشرها ور شیا 

أو تداوليا تسار با 


ıı 
š 
Uu: $3 
الوضو. الصفحة‎ 
۵ کلمة الرکز‎ 
5۳ 27 
۳ تعریف بالباحتین الشارکین 2 التأليف‎ 
12222-22355 
1 Boost او وی الدوكة‎ 
ثانیا؛ طرق الإفادة من المدونات اللفوية ل‎ 
۲۲ ثالثا: آنواع الدونات اللفوية‎ 


YA انشاء المدونة اللغوية‎ ial 


iaiia] 2713‏ 
اهداء من المركز 
و لا Le pitia penas‏ ور قیا 

او تداو لیا تسا با 
î‏ 


سادسًا: وسائل جمع نصوص المدونة وتخزينها 
سابعًا: مصطلحات مهمة 2 مجال لسانيات المدونات 
ثامنا: أمثلة لمدونات للغة العربية 

تاسفاء متطلبات التعامل ارات 

TETE et cas ماشر‎ 
الخاتمة‎ 

قائمة بمدونات لغوية عربية 

المصادر 

المراجع 

الراجع العربية 

الراجع الانجليزية 

المبحث الثاني : مدونات التعلمین 

المقدمة 

ما هي مدونات المتعلمين؟ 

بداية مدونات التعلمین 

حدود مدونات المتعلمين 

تصنیف مدونات المتعلمين 


AV 


AA 


iaiia] 2713‏ 
اهداء من الرکز 
و لا Le pitia penas‏ ور LÀ‏ 

او تداولها تسار با 
î‏ 


ماذا يميز مدونات المتعلمين عن غيرها؟ 
مدونات المتعلمين العربية 

مجالات الإفادة من مدونات المتعلمين 
وسم مدونات المتعلمين 

الخاتمة 

شكر وعرفان 

الحواشي 

مصادر إضافية حول مدونات التعلمین 
المراجع 

المراجع العربية 

المراجع الإنجليزية 


cou‏ الثالث: تصميم المدونات اللغوية ويناوها 


"m 


A1 


Af 


۱۷ 


قند iakat]‏ 
إهداء من المركز 
والايسمح Le ia‏ ور LÀ‏ 
او تداولها تسار با 
î‏ 


56 


۰ تاريخ النصوص 

۳ المنطقة الجغرافية 

۳ الوعاء 

۳ الجال 

۳ حجم العينة 

۳ حجم الدونة 

A.Y‏ معايير أخرى 

٠١ ."‏ التمثيل والتوازن 

١١ ۳‏ البيانات الأساسية للنصوص 
بناء المدونات 

". أ حقوق الملكية الفكرية 

". ب تحديد المصادر 

«Y‏ ج الجمع 

oca‏ والتشفية والحفخل 
*. ه التحشية 

الأدوات 


FIVE 
اهداء من المركز‎ 
والايسمح بنشرها ورقيا‎ 

او تداولهيا تسا با 
î‏ 


معايير التصميم 

SEE 

الخاتمة 

الحواشي 

المراجع 

المبحث الرابع: لسانيات الدونات: نماذج وتطبيقات 4 لغة 
الصحافة العربية 


معد مه 

الإطار النظري 

الدراسة الحالية: لسانيات المدونات وإمكانات البحث المتاحة 
بيانات الدراسة وأدوات التحليل 

نتائج الدراسة 

مناقشة نتائج الدراسة 

الخاتمة 


الحواشي 


iaiia] 2713‏ 
اهداء من المركز 
و لا یسح Le pitia‏ ور Là‏ 

al‏ تداو لیا تسا با 


1 5 — — 
الراجع ۳۳۹ 
E FAR‏ ۳۳۹ 
المراجع الإنجليزية d‏ 
المبحث الخامس: البحث اللغوي 2 المدونات العربية 0 
الحاسوبية بين الممكن والمحتمل والمأمول 
التمهید ۳۳۷ 
البحث اللفوي والدونات العربية الحاسوبية ۳۳۸ 
.١ Lo‏ البحث اللغوي المعتمد على المدونة والموجه بالمدونة ye‏ 
Y .0‏ أدوت معالجة النصوص العربية Ye‏ 
۵ . علاقة بناء المدونة اللغوية العربية الحاسوبية وأدوات Yoo‏ 
التحليل بطرائق البحث اللغوي 
۵ 0. تحليل التصاحب اللغوي Yol‏ 
الاتجاهات البحثية المحتملة Y‏ 


موضوعات مقترحة 2 البحث اللغوي الحاسوبي TAY‏ 


خاتمة 


aiiai asia 
من الرکز‎ lal 
بنشرها ورقيا‎ LE 
او تداو لها تسار با‎ 
mı 


۳۹۹ 


۳۹۹ 


الحواشي 


الراجع 
الراجع العربية 
الراجع الانجليزية 


خاتمة: نظرة تأمل الماضي واستشراف الستقبل: صالح بن فهد 


العصيمي 


۳۷۲ 
۳۷۲ 


VY 


YAY 


YAO 


مسرد المصطلحات 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


sse‏ انعر 
إضداء من | e‏ 
iem‏ 
أو تداو 


